خبر و ترفند روز

خبر و ترفند های روز را اینجا بخوانید!

یادگیری Zero Shot چیست و چگونه می تواند هوش مصنوعی را بهبود بخشد

یادگیری بدون شات چندین مشکل را در یادگیری ماشین حل می کند، اما چگونه کار می کند و چگونه هوش مصنوعی را بهتر می کند؟

نکات کلیدی

  • تعمیم در یادگیری عمیق برای اطمینان از پیش بینی های دقیق با داده های جدید ضروری است. یادگیری صفر شات با اجازه دادن به هوش مصنوعی برای استفاده از دانش موجود برای پیش‌بینی دقیق در کلاس‌های جدید یا دیده نشده بدون داده‌های برچسب‌گذاری شده به این مهم کمک می‌کند.
  • یادگیری صفر شات از نحوه یادگیری و پردازش داده ها توسط انسان ها تقلید می کند. با ارائه اطلاعات معنایی اضافی، یک مدل از پیش آموزش‌دیده می‌تواند به‌طور دقیق کلاس‌های جدید را شناسایی کند، همانطور که یک انسان می‌تواند با درک ویژگی‌های گیتار توخالی، تشخیص دهد.
  • یادگیری شات صفر با بهبود تعمیم، مقیاس پذیری، کاهش بیش از حد برازش و مقرون به صرفه بودن، هوش مصنوعی را بهبود می بخشد. این اجازه می دهد تا مدل ها بر روی مجموعه داده های بزرگ تر آموزش داده شوند، دانش بیشتری از طریق یادگیری انتقال به دست آورند، درک زمینه ای بهتری داشته باشند و نیاز به داده های برچسب گذاری شده گسترده را کاهش دهند. با پیشرفت هوش مصنوعی، یادگیری صفر شات در پرداختن به چالش های پیچیده در زمینه های مختلف اهمیت بیشتری پیدا می کند.

یکی از بزرگترین اهداف یادگیری عمیق، آموزش مدل هایی است که دانش تعمیم یافته را به دست آورده اند. تعمیم ضروری است زیرا تضمین می کند که مدل الگوهای معنی داری را یاد گرفته است و می تواند در صورت مواجهه با داده های جدید یا نادیده، پیش بینی ها یا تصمیمات دقیقی اتخاذ کند. آموزش چنین مدل هایی اغلب به مقدار قابل توجهی از داده های برچسب دار نیاز دارد. با این حال، چنین داده هایی می تواند پرهزینه، کار فشرده و گاهی غیرممکن باشد.

یادگیری صفر شات برای پر کردن این شکاف پیاده‌سازی شده است و به هوش مصنوعی اجازه می‌دهد از دانش موجود خود برای پیش‌بینی‌های نسبتاً دقیق علی‌رغم کمبود داده‌های برچسب‌گذاری شده استفاده کند.

یادگیری صفر شات چیست؟

یادگیری شات صفر نوع خاصی از تکنیک یادگیری انتقالی است. تمرکز آن بر استفاده از یک مدل از پیش آموزش‌دیده برای شناسایی کلاس‌های جدید یا قبلاً دیده نشده است، صرفاً با ارائه اطلاعات اضافی که جزئیات کلاس جدید را توصیف می‌کند.

مطلب مرتبط:   7 روشی که می توان از هوش مصنوعی در تولید موسیقی استفاده کرد

با استفاده از دانش عمومی یک مدل از موضوعات خاص و دادن معنایی اضافی به آن در مورد آنچه که باید به دنبال آن بگردید، باید بتواند دقیقاً مشخص کند که چه موضوعی وظیفه شناسایی آن را دارد.

فرض کنید باید گورخر را شناسایی کنیم. با این حال، ما مدلی نداریم که بتواند چنین حیواناتی را شناسایی کند. بنابراین، ما یک مدل از قبل آموزش دیده برای شناسایی اسب ها دریافت می کنیم و به مدل می گوییم که اسب هایی با نوارهای سیاه و سفید گورخر هستند. هنگامی که ما شروع به استنباط مدل با ارائه تصاویری از گورخرها و اسب ها می کنیم، احتمال زیادی وجود دارد که مدل هر حیوان را به درستی شناسایی کند.

مانند بسیاری از تکنیک های یادگیری عمیق، یادگیری صفر شات از نحوه یادگیری و پردازش داده ها توسط انسان ها تقلید می کند. انسان‌ها به‌عنوان یادگیرنده‌های طبیعی بدون شات شناخته می‌شوند. اگر وظیفه پیدا کردن یک گیتار توخالی در یک فروشگاه موسیقی را داشتید، ممکن است در جستجوی آن مشکل داشته باشید. اما وقتی به شما بگویم که بدنه توخالی اساساً یک گیتار است که در یک یا هر دو طرف آن یک سوراخ F شکل دارد، احتمالاً بلافاصله یکی را پیدا خواهید کرد.

دیواری از گیتارهای نیمه توخالی

برای مثال در دنیای واقعی، بیایید از برنامه طبقه بندی صفر شات توسط سایت میزبان LLM منبع باز Hugging Face با استفاده از مدل clip-vit-large استفاده کنیم.

تصویر ورودی آموزش صفر شات

این عکس تصویری از نان را در یک کیسه خواربار که روی یک صندلی بلند بسته شده است به تصویر می کشد. از آنجایی که این مدل بر روی مجموعه داده بزرگی از تصاویر آموزش داده شده است، مدل احتمالاً می‌تواند هر مورد در عکس مانند نان، مواد غذایی، صندلی و کمربند ایمنی را شناسایی کند.

اکنون می خواهیم مدل با استفاده از کلاس های دیده نشده قبلی، تصویر را طبقه بندی کند. در این مورد، کلاس‌های بدیع یا دیده نشده «نان آرام»، «نان مطمئن»، «نان نشسته»، «رانندگی خواربارفروشی» و «بقالی مطمئن» خواهد بود.

توجه داشته باشید که ما عمداً از کلاس‌ها و تصاویر دیده نشده غیرمعمول برای نشان دادن اثربخشی طبقه‌بندی عکس صفر بر روی یک تصویر استفاده کرده‌ایم.

مطلب مرتبط:   من استفاده از Llama 3.2 را شروع کرده ام و ای کاش خیلی زودتر تغییر می کردم

نتیجه رده بندی صفر شات

پس از استنباط مدل، توانست با اطمینان حدود 80 درصد طبقه بندی کند که مناسب ترین طبقه بندی برای تصویر «نان ایمن» است. این احتمالاً به این دلیل است که مدل فکر می‌کند که صندلی بلند برای ایمنی بیشتر از نشستن، آرامش یا رانندگی است.

عالی! من شخصا با خروجی مدل موافقم. اما این مدل دقیقاً چگونه چنین خروجی را به دست آورد؟ در اینجا یک برداشت کلی از نحوه عملکرد یادگیری صفر شات ارائه شده است.

آموزش صفر شات چگونه کار می کند

یادگیری صفر شات می تواند به یک مدل از پیش آموزش دیده کمک کند تا کلاس های جدید را بدون ارائه داده های برچسب دار شناسایی کند. در ساده ترین شکل، یادگیری صفر شات در سه مرحله انجام می شود:

1. آماده سازی

انواع داده های مورد استفاده در ZLS

یادگیری صفر شات با تهیه سه نوع داده شروع می شود

  • کلاس دیده شده: داده های مورد استفاده در آموزش مدل از پیش آموزش دیده. این مدل قبلاً کلاس های دیده شده را ارائه می دهد. بهترین مدل‌ها برای یادگیری شات صفر، مدل‌هایی هستند که بر روی کلاس‌هایی که نزدیک به کلاس جدیدی هستند که می‌خواهید مدل شناسایی کند، آموزش داده شده‌اند.
  • کلاس نادیده/ بدیع: داده هایی که هرگز در طول آموزش مدل استفاده نشدند. شما باید خودتان این داده ها را مدیریت کنید زیرا نمی توانید آن را از مدل دریافت کنید.
  • داده های معنایی/ کمکی: بیت های اضافی داده ای که می تواند به مدل در شناسایی کلاس جدید کمک کند. این می تواند در کلمات، عبارات، جاسازی کلمات، یا نام کلاس باشد.

2. نگاشت معنایی

تصویر نگاشت معنایی ZLS و یادگیری انتقال

گام بعدی ترسیم ویژگی های کلاس غیب است. این کار با ایجاد جاسازی کلمات و ساختن یک نقشه معنایی انجام می شود که ویژگی ها یا ویژگی های کلاس نامرئی را به داده های کمکی ارائه شده پیوند می دهد. یادگیری انتقال هوش مصنوعی فرآیند را بسیار سریع‌تر می‌کند، زیرا بسیاری از ویژگی‌های مربوط به کلاس پنهان قبلاً نقشه‌برداری شده‌اند.

3. استنباط

تصویر استنتاج ZLS

استنتاج استفاده از مدل برای تولید پیش‌بینی یا خروجی است. در طبقه بندی تصویر صفر شات، جاسازی های کلمه بر روی ورودی تصویر داده شده ایجاد می شود و سپس رسم می شود و با داده های کمکی مقایسه می شود. سطح اطمینان به شباهت بین ورودی و داده های کمکی ارائه شده بستگی دارد.

مطلب مرتبط:   DALL-E را فراموش کنید: این بهترین تولیدکننده متن به تصویر هوش مصنوعی است...

چگونه یادگیری شات صفر هوش مصنوعی را بهبود می بخشد؟

یادگیری بدون شات با پرداختن به چندین چالش در یادگیری ماشینی، مدل های هوش مصنوعی را بهبود می بخشد، از جمله:

  • تعمیم بهبود یافته: کاهش وابستگی به داده‌های برچسب‌گذاری شده به مدل‌ها اجازه می‌دهد تا در مجموعه داده‌های بزرگ‌تر آموزش داده شوند، تعمیم‌سازی را بهبود بخشیده و مدل را قوی‌تر و قابل اعتمادتر می‌سازد. همانطور که مدل‌ها با تجربه‌تر و تعمیم‌یافته‌تر می‌شوند، حتی ممکن است مدل‌ها به جای روش معمول تجزیه و تحلیل اطلاعات، عقل سلیم را یاد بگیرند.
  • مقیاس پذیری: مدل ها را می توان به طور مداوم آموزش داد و از طریق یادگیری انتقالی دانش بیشتری به دست آورد. شرکت ها و محققان مستقل می توانند مدل های خود را به طور مستمر بهبود بخشند تا در آینده توانایی بیشتری داشته باشند.
  • کاهش احتمال اضافه برازش: برازش بیش از حد ممکن است به دلیل آموزش مدل بر روی یک مجموعه داده کوچک که دارای تنوع کافی برای نمایش همه ورودی‌های ممکن نیست، رخ دهد. آموزش مدل از طریق یادگیری شات صفر، با آموزش مدل برای درک متنی بهتر موضوعات، شانس بیش از حد برازش را کاهش می دهد.
  • مقرون به صرفه: ارائه مقدار زیادی از داده های برچسب دار می تواند زمان و منابعی را ببرد. با استفاده از یادگیری انتقال شات صفر، آموزش یک مدل قوی را می توان با زمان بسیار کمتر و داده های برچسب دار انجام داد.

با پیشرفت هوش مصنوعی، تکنیک هایی مانند یادگیری بدون شات اهمیت بیشتری پیدا می کنند.

آینده یادگیری صفر شات

یادگیری بدون شات به بخشی ضروری از یادگیری ماشین تبدیل شده است. این مدل‌ها را قادر می‌سازد تا کلاس‌های جدید را بدون آموزش صریح شناسایی و طبقه‌بندی کنند. با پیشرفت مداوم در معماری مدل، رویکردهای مبتنی بر ویژگی و ادغام چندوجهی، یادگیری صفر شات می تواند به طور قابل توجهی به سازگاری بیشتر مدل ها در پرداختن به چالش های پیچیده در رباتیک، مراقبت های بهداشتی و بینایی کامپیوتر کمک کند.