گوگل بهروزرسانی عظیمی را برای مدل هوش مصنوعی Gemini خود ارائه میکند و تأثیر زیادی بر همه چترباتهای هوش مصنوعی خواهد داشت.
خلاصه عناوین
- پنجره زمینه چیست؟
- چرا پنجره زمینه Gemini 1.5 یک معامله بزرگ است
- آیا Gemini 1.5 مطابق انتظارات خواهد بود؟
نکات کلیدی
- Google Gemini 1.5 یک پنجره زمینه یک میلیون توکن را معرفی میکند که از رقبایی مانند Claude و ChatGPT پیشی میگیرد.
- یک پنجره زمینه بزرگتر عملکرد یک مدل هوش مصنوعی را افزایش می دهد و خطاها را کاهش می دهد، اما ممکن است موفقیت کلی را تضمین نکند.
- پنجره زمینه بزرگتر Gemini 1.5 می تواند دقت را تا حد زیادی افزایش دهد، خطاها را کاهش دهد و درک را بهبود بخشد.
Google Gemini 1.5 اکنون با یک پنجره زمینه عظیم یک میلیون رمزی عرضه میشود که از رقبای مستقیم خود در ChatGPT، Claude و دیگر چترباتهای هوش مصنوعی کوچکتر است.
به نظر یک ارتقاء عظیم است و می تواند Gemini را متمایز کند. درک گستره کامل آن کمی دشوار است – اما پنجره زمینه عظیم Gemini می تواند یک تغییر دهنده بازی باشد.
پنجره زمینه چیست؟
مدلهای هوش مصنوعی در حین پاسخ به سؤالات شما، مانند توضیح مفهوم یا خلاصه کردن یک متن، محدودیتی در میزان دادهای دارند که میتوانند برای تولید پاسخ در نظر بگیرند. محدودیت اندازه متنی که می تواند در نظر بگیرد پنجره زمینه نامیده می شود.
در اینجا راه دیگری برای نگاه کردن به آن وجود دارد. فرض کنید برای تهیه مواد غذایی بدون لیست مواد غذایی به یک فروشگاه مواد غذایی می روید. محدودیت تعداد مواد غذایی که هنگام خرید به خاطر می آورید، پنجره زمینه شماست. هر چه بتوانید مواد غذایی بیشتری را به خاطر بسپارید، احتمال اینکه برنامه های خرید خود را به هم نریزید بیشتر است. به طور مشابه، هر چه پنجره زمینه یک مدل هوش مصنوعی بزرگتر باشد، شانس بیشتری برای به خاطر سپردن هر چیزی که مدل نیاز دارد تا بهترین نتایج را به شما ارائه دهد، بیشتر می شود.
در زمان نگارش، پنجره زمینه 200k کلود 2.1 Anthropic بزرگترین پنجره زمینه در بین هر مدل هوش مصنوعی عمومی موجود است. به دنبال آن GPT-4 Turbo با یک پنجره زمینه 128k قرار می گیرد. Google Gemini 1.5 یک میلیون پنجره زمینه را به ارمغان می آورد که چهار برابر بزرگتر از هر چیزی در بازار است. این منجر به این سوال بزرگ می شود: معامله بزرگ با یک میلیون توکن پنجره زمینه چیست؟
چرا پنجره زمینه Gemini 1.5 یک معامله بزرگ است
برای قرار دادن آن در یک چشم انداز واضح تر، پنجره زمینه 200k کلود هوش مصنوعی به این معنی است که می تواند کتابی با حدود 150000 کلمه را هضم کند و به آن پاسخ دهد. این عظیم است. اما Gemini 1.5 گوگل قادر به هضم 700000 کلمه در هر لحظه خواهد بود!
وقتی یک بلوک متنی بزرگ را به چت رباتهای هوش مصنوعی مانند ChatGPT یا Gemini وارد میکنید، سعی میکند تا جایی که ممکن است متن را هضم کند، اما اینکه چقدر میتواند هضم شود به پنجره زمینه آن بستگی دارد. بنابراین، اگر مکالمهای دارید که شامل 100 هزار کلمه در مدلی است که فقط میتواند 28 هزار کلمه را مدیریت کند و سپس شروع به پرسیدن سؤالاتی کنید که نیاز به دانش کامل از کل 100 هزار کلمه مکالمه داشته باشد، آن را طوری تنظیم میکنید که شکست بخورد.
تصور کنید فقط 20 دقیقه از یک فیلم یک ساعته را تماشا می کنید اما از شما خواسته می شود که کل فیلم را توضیح دهید. نتایج شما چقدر خوب خواهد بود؟ شما یا از پاسخ دادن امتناع میکنید یا به سادگی چیزهایی درست میکنید، این دقیقاً همان کاری است که یک چت ربات هوش مصنوعی انجام میدهد و منجر به توهمات هوش مصنوعی میشود.
حال، اگر فکر میکنید که هرگز مجبور نبودهاید 100 هزار کلمه را به یک ربات چت وارد کنید، این همه چیز نیست. پنجره زمینه فقط از متنی که شما به یک مدل هوش مصنوعی در یک اعلان میدهید فراتر میرود. مدلهای هوش مصنوعی کل مکالمهای که در طول یک جلسه چت داشتهاید را در نظر میگیرند تا اطمینان حاصل کنند که پاسخهایشان تا حد امکان مرتبط است.
بنابراین، حتی اگر یک کتاب 100 هزار کلمه ای به آن نمی دهید، مکالمات پشت سر هم و پاسخ هایی که ارائه می دهد، همگی به محاسبه پنجره زمینه می افزایند. تعجب می کنید که چرا ChatGPT یا Gemini گوگل همیشه چیزهایی را که قبلا در یک مکالمه به آن گفته اید فراموش می کند؟ احتمالاً فضای پنجره زمینه تمام شده و شروع به فراموش کردن مطالب کرده است.
یک پنجره زمینه بزرگتر به ویژه برای کارهایی که نیاز به درک عمیق زمینه دارند، مانند خلاصه کردن مقالات طولانی، پاسخ به سؤالات پیچیده یا حفظ یک روایت منسجم در متن تولید شده، مهم است. آیا می خواهید رمانی 50 هزار کلمه ای بنویسید که روایتی ثابت در سرتاسر آن داشته باشد؟ مدلی میخواهید که بتواند در یک فایل ویدیویی یک ساعته به سؤالات «تماشا» و پاسخ دهد؟ شما به یک پنجره زمینه بزرگتر نیاز دارید!
به طور خلاصه، پنجره زمینه بزرگتر Gemini 1.5 ممکن است به طور قابل توجهی عملکرد مدل هوش مصنوعی خود را بهبود بخشد، توهم را کاهش دهد و دقت و توانایی برای پیروی بهتر دستورالعمل ها را به طور قابل توجهی افزایش دهد.
آیا Gemini 1.5 مطابق انتظارات خواهد بود؟
اگر همه چیز طبق برنامه پیش برود، Gemini 1.5 به طور بالقوه می تواند از بهترین مدل های هوش مصنوعی در بازار بهتر عمل کند. با این حال، با توجه به شکستهای زیاد گوگل در ساخت یک مدل هوش مصنوعی پایدار، مهم است که احتیاط کنید. بالا بردن پنجره زمینه یک مدل به تنهایی به طور خودکار مدل را بهتر نمی کند.
من از پنجره زمینه 200k کلود 2.1 ماه ها از زمان انتشار آن استفاده کرده ام، و یک چیز برای من واضح است – یک پنجره زمینه بزرگتر در واقع می تواند حساسیت زمینه را بهبود بخشد، اما مشکلات مربوط به عملکرد مدل اصلی می تواند زمینه بزرگتر را مشکل آن کند. خود.
آیا Google Gemini 1.5 تغییر دهنده بازی به ما می دهد؟ رسانههای اجتماعی در حال حاضر مملو از بررسیهای درخشان Gemini 1.5 از سوی کاربرانی است که دسترسی اولیه دارند. با این حال، بیشتر بررسی های 5 ستاره از موارد استفاده عجولانه یا ساده ناشی می شود. یک مکان خوب برای بررسی عملکرد Gemini 1.5 در طبیعت، داخل گزارش فنی Gemini 1.5 گوگل [PDF] است. این گزارش نشان میدهد که حتی در طی «آزمایش کنترلشده»، این مدل نمیتواند تمام جزئیات کوچک اسناد را در اندازه پنجره زمینه خود بازیابی کند.
یک پنجره زمینه یک میلیون رمزی در واقع یک شاهکار فنی چشمگیر است، اما بدون اینکه بتوان جزئیات یک سند را به طور قابل اعتماد بازیابی کرد، پس یک پنجره زمینه بزرگتر ارزش عملی کمی دارد و حتی می تواند دلیلی برای کاهش دقت و توهم باشد.