یادگیری بدون شات چندین مشکل را در یادگیری ماشین حل می کند، اما چگونه کار می کند و چگونه هوش مصنوعی را بهتر می کند؟
نکات کلیدی
- تعمیم در یادگیری عمیق برای اطمینان از پیش بینی های دقیق با داده های جدید ضروری است. یادگیری صفر شات با اجازه دادن به هوش مصنوعی برای استفاده از دانش موجود برای پیشبینی دقیق در کلاسهای جدید یا دیده نشده بدون دادههای برچسبگذاری شده به این مهم کمک میکند.
- یادگیری صفر شات از نحوه یادگیری و پردازش داده ها توسط انسان ها تقلید می کند. با ارائه اطلاعات معنایی اضافی، یک مدل از پیش آموزشدیده میتواند بهطور دقیق کلاسهای جدید را شناسایی کند، همانطور که یک انسان میتواند با درک ویژگیهای گیتار توخالی، تشخیص دهد.
- یادگیری شات صفر با بهبود تعمیم، مقیاس پذیری، کاهش بیش از حد برازش و مقرون به صرفه بودن، هوش مصنوعی را بهبود می بخشد. این اجازه می دهد تا مدل ها بر روی مجموعه داده های بزرگ تر آموزش داده شوند، دانش بیشتری از طریق یادگیری انتقال به دست آورند، درک زمینه ای بهتری داشته باشند و نیاز به داده های برچسب گذاری شده گسترده را کاهش دهند. با پیشرفت هوش مصنوعی، یادگیری صفر شات در پرداختن به چالش های پیچیده در زمینه های مختلف اهمیت بیشتری پیدا می کند.
یکی از بزرگترین اهداف یادگیری عمیق، آموزش مدل هایی است که دانش تعمیم یافته را به دست آورده اند. تعمیم ضروری است زیرا تضمین می کند که مدل الگوهای معنی داری را یاد گرفته است و می تواند در صورت مواجهه با داده های جدید یا نادیده، پیش بینی ها یا تصمیمات دقیقی اتخاذ کند. آموزش چنین مدل هایی اغلب به مقدار قابل توجهی از داده های برچسب دار نیاز دارد. با این حال، چنین داده هایی می تواند پرهزینه، کار فشرده و گاهی غیرممکن باشد.
یادگیری صفر شات برای پر کردن این شکاف پیادهسازی شده است و به هوش مصنوعی اجازه میدهد از دانش موجود خود برای پیشبینیهای نسبتاً دقیق علیرغم کمبود دادههای برچسبگذاری شده استفاده کند.
یادگیری صفر شات چیست؟
یادگیری شات صفر نوع خاصی از تکنیک یادگیری انتقالی است. تمرکز آن بر استفاده از یک مدل از پیش آموزشدیده برای شناسایی کلاسهای جدید یا قبلاً دیده نشده است، صرفاً با ارائه اطلاعات اضافی که جزئیات کلاس جدید را توصیف میکند.
با استفاده از دانش عمومی یک مدل از موضوعات خاص و دادن معنایی اضافی به آن در مورد آنچه که باید به دنبال آن بگردید، باید بتواند دقیقاً مشخص کند که چه موضوعی وظیفه شناسایی آن را دارد.
فرض کنید باید گورخر را شناسایی کنیم. با این حال، ما مدلی نداریم که بتواند چنین حیواناتی را شناسایی کند. بنابراین، ما یک مدل از قبل آموزش دیده برای شناسایی اسب ها دریافت می کنیم و به مدل می گوییم که اسب هایی با نوارهای سیاه و سفید گورخر هستند. هنگامی که ما شروع به استنباط مدل با ارائه تصاویری از گورخرها و اسب ها می کنیم، احتمال زیادی وجود دارد که مدل هر حیوان را به درستی شناسایی کند.
مانند بسیاری از تکنیک های یادگیری عمیق، یادگیری صفر شات از نحوه یادگیری و پردازش داده ها توسط انسان ها تقلید می کند. انسانها بهعنوان یادگیرندههای طبیعی بدون شات شناخته میشوند. اگر وظیفه پیدا کردن یک گیتار توخالی در یک فروشگاه موسیقی را داشتید، ممکن است در جستجوی آن مشکل داشته باشید. اما وقتی به شما بگویم که بدنه توخالی اساساً یک گیتار است که در یک یا هر دو طرف آن یک سوراخ F شکل دارد، احتمالاً بلافاصله یکی را پیدا خواهید کرد.
برای مثال در دنیای واقعی، بیایید از برنامه طبقه بندی صفر شات توسط سایت میزبان LLM منبع باز Hugging Face با استفاده از مدل clip-vit-large استفاده کنیم.
این عکس تصویری از نان را در یک کیسه خواربار که روی یک صندلی بلند بسته شده است به تصویر می کشد. از آنجایی که این مدل بر روی مجموعه داده بزرگی از تصاویر آموزش داده شده است، مدل احتمالاً میتواند هر مورد در عکس مانند نان، مواد غذایی، صندلی و کمربند ایمنی را شناسایی کند.
اکنون می خواهیم مدل با استفاده از کلاس های دیده نشده قبلی، تصویر را طبقه بندی کند. در این مورد، کلاسهای بدیع یا دیده نشده «نان آرام»، «نان مطمئن»، «نان نشسته»، «رانندگی خواربارفروشی» و «بقالی مطمئن» خواهد بود.
توجه داشته باشید که ما عمداً از کلاسها و تصاویر دیده نشده غیرمعمول برای نشان دادن اثربخشی طبقهبندی عکس صفر بر روی یک تصویر استفاده کردهایم.
پس از استنباط مدل، توانست با اطمینان حدود 80 درصد طبقه بندی کند که مناسب ترین طبقه بندی برای تصویر «نان ایمن» است. این احتمالاً به این دلیل است که مدل فکر میکند که صندلی بلند برای ایمنی بیشتر از نشستن، آرامش یا رانندگی است.
عالی! من شخصا با خروجی مدل موافقم. اما این مدل دقیقاً چگونه چنین خروجی را به دست آورد؟ در اینجا یک برداشت کلی از نحوه عملکرد یادگیری صفر شات ارائه شده است.
آموزش صفر شات چگونه کار می کند
یادگیری صفر شات می تواند به یک مدل از پیش آموزش دیده کمک کند تا کلاس های جدید را بدون ارائه داده های برچسب دار شناسایی کند. در ساده ترین شکل، یادگیری صفر شات در سه مرحله انجام می شود:
1. آماده سازی
یادگیری صفر شات با تهیه سه نوع داده شروع می شود
- کلاس دیده شده: داده های مورد استفاده در آموزش مدل از پیش آموزش دیده. این مدل قبلاً کلاس های دیده شده را ارائه می دهد. بهترین مدلها برای یادگیری شات صفر، مدلهایی هستند که بر روی کلاسهایی که نزدیک به کلاس جدیدی هستند که میخواهید مدل شناسایی کند، آموزش داده شدهاند.
- کلاس نادیده/ بدیع: داده هایی که هرگز در طول آموزش مدل استفاده نشدند. شما باید خودتان این داده ها را مدیریت کنید زیرا نمی توانید آن را از مدل دریافت کنید.
- داده های معنایی/ کمکی: بیت های اضافی داده ای که می تواند به مدل در شناسایی کلاس جدید کمک کند. این می تواند در کلمات، عبارات، جاسازی کلمات، یا نام کلاس باشد.
2. نگاشت معنایی
گام بعدی ترسیم ویژگی های کلاس غیب است. این کار با ایجاد جاسازی کلمات و ساختن یک نقشه معنایی انجام می شود که ویژگی ها یا ویژگی های کلاس نامرئی را به داده های کمکی ارائه شده پیوند می دهد. یادگیری انتقال هوش مصنوعی فرآیند را بسیار سریعتر میکند، زیرا بسیاری از ویژگیهای مربوط به کلاس پنهان قبلاً نقشهبرداری شدهاند.
3. استنباط
استنتاج استفاده از مدل برای تولید پیشبینی یا خروجی است. در طبقه بندی تصویر صفر شات، جاسازی های کلمه بر روی ورودی تصویر داده شده ایجاد می شود و سپس رسم می شود و با داده های کمکی مقایسه می شود. سطح اطمینان به شباهت بین ورودی و داده های کمکی ارائه شده بستگی دارد.
چگونه یادگیری شات صفر هوش مصنوعی را بهبود می بخشد؟
یادگیری بدون شات با پرداختن به چندین چالش در یادگیری ماشینی، مدل های هوش مصنوعی را بهبود می بخشد، از جمله:
- تعمیم بهبود یافته: کاهش وابستگی به دادههای برچسبگذاری شده به مدلها اجازه میدهد تا در مجموعه دادههای بزرگتر آموزش داده شوند، تعمیمسازی را بهبود بخشیده و مدل را قویتر و قابل اعتمادتر میسازد. همانطور که مدلها با تجربهتر و تعمیمیافتهتر میشوند، حتی ممکن است مدلها به جای روش معمول تجزیه و تحلیل اطلاعات، عقل سلیم را یاد بگیرند.
- مقیاس پذیری: مدل ها را می توان به طور مداوم آموزش داد و از طریق یادگیری انتقالی دانش بیشتری به دست آورد. شرکت ها و محققان مستقل می توانند مدل های خود را به طور مستمر بهبود بخشند تا در آینده توانایی بیشتری داشته باشند.
- کاهش احتمال اضافه برازش: برازش بیش از حد ممکن است به دلیل آموزش مدل بر روی یک مجموعه داده کوچک که دارای تنوع کافی برای نمایش همه ورودیهای ممکن نیست، رخ دهد. آموزش مدل از طریق یادگیری شات صفر، با آموزش مدل برای درک متنی بهتر موضوعات، شانس بیش از حد برازش را کاهش می دهد.
- مقرون به صرفه: ارائه مقدار زیادی از داده های برچسب دار می تواند زمان و منابعی را ببرد. با استفاده از یادگیری انتقال شات صفر، آموزش یک مدل قوی را می توان با زمان بسیار کمتر و داده های برچسب دار انجام داد.
با پیشرفت هوش مصنوعی، تکنیک هایی مانند یادگیری بدون شات اهمیت بیشتری پیدا می کنند.
آینده یادگیری صفر شات
یادگیری بدون شات به بخشی ضروری از یادگیری ماشین تبدیل شده است. این مدلها را قادر میسازد تا کلاسهای جدید را بدون آموزش صریح شناسایی و طبقهبندی کنند. با پیشرفت مداوم در معماری مدل، رویکردهای مبتنی بر ویژگی و ادغام چندوجهی، یادگیری صفر شات می تواند به طور قابل توجهی به سازگاری بیشتر مدل ها در پرداختن به چالش های پیچیده در رباتیک، مراقبت های بهداشتی و بینایی کامپیوتر کمک کند.