چرا زمینه یک میلیون توکن Gemini 1.5 یک تغییر دهنده بازی است

گوگل به‌روزرسانی عظیمی را برای مدل هوش مصنوعی Gemini خود ارائه می‌کند و تأثیر زیادی بر همه چت‌ربات‌های هوش مصنوعی خواهد داشت.

خلاصه عناوین

پنجره زمینه چیست؟

چرا پنجره زمینه Gemini 1.5 یک معامله بزرگ است

آیا Gemini 1.5 مطابق انتظارات خواهد بود؟

نکات کلیدی

Google Gemini 1.5 یک پنجره زمینه یک میلیون توکن را معرفی می‌کند که از رقبایی مانند Claude و ChatGPT پیشی می‌گیرد.
یک پنجره زمینه بزرگتر عملکرد یک مدل هوش مصنوعی را افزایش می دهد و خطاها را کاهش می دهد، اما ممکن است موفقیت کلی را تضمین نکند.
پنجره زمینه بزرگتر Gemini 1.5 می تواند دقت را تا حد زیادی افزایش دهد، خطاها را کاهش دهد و درک را بهبود بخشد.

Google Gemini 1.5 اکنون با یک پنجره زمینه عظیم یک میلیون رمزی عرضه می‌شود که از رقبای مستقیم خود در ChatGPT، Claude و دیگر چت‌ربات‌های هوش مصنوعی کوچکتر است.

به نظر یک ارتقاء عظیم است و می تواند Gemini را متمایز کند. درک گستره کامل آن کمی دشوار است – اما پنجره زمینه عظیم Gemini می تواند یک تغییر دهنده بازی باشد.

پنجره زمینه چیست؟

مدل‌های هوش مصنوعی در حین پاسخ به سؤالات شما، مانند توضیح مفهوم یا خلاصه کردن یک متن، محدودیتی در میزان داده‌ای دارند که می‌توانند برای تولید پاسخ در نظر بگیرند. محدودیت اندازه متنی که می تواند در نظر بگیرد پنجره زمینه نامیده می شود.

در اینجا راه دیگری برای نگاه کردن به آن وجود دارد. فرض کنید برای تهیه مواد غذایی بدون لیست مواد غذایی به یک فروشگاه مواد غذایی می روید. محدودیت تعداد مواد غذایی که هنگام خرید به خاطر می آورید، پنجره زمینه شماست. هر چه بتوانید مواد غذایی بیشتری را به خاطر بسپارید، احتمال اینکه برنامه های خرید خود را به هم نریزید بیشتر است. به طور مشابه، هر چه پنجره زمینه یک مدل هوش مصنوعی بزرگتر باشد، شانس بیشتری برای به خاطر سپردن هر چیزی که مدل نیاز دارد تا بهترین نتایج را به شما ارائه دهد، بیشتر می شود.

مطلب مرتبط: Chromebook برای چه کاری خوب است؟

در زمان نگارش، پنجره زمینه 200k کلود 2.1 Anthropic بزرگترین پنجره زمینه در بین هر مدل هوش مصنوعی عمومی موجود است. به دنبال آن GPT-4 Turbo با یک پنجره زمینه 128k قرار می گیرد. Google Gemini 1.5 یک میلیون پنجره زمینه را به ارمغان می آورد که چهار برابر بزرگتر از هر چیزی در بازار است. این منجر به این سوال بزرگ می شود: معامله بزرگ با یک میلیون توکن پنجره زمینه چیست؟

چرا پنجره زمینه Gemini 1.5 یک معامله بزرگ است

برای قرار دادن آن در یک چشم انداز واضح تر، پنجره زمینه 200k کلود هوش مصنوعی به این معنی است که می تواند کتابی با حدود 150000 کلمه را هضم کند و به آن پاسخ دهد. این عظیم است. اما Gemini 1.5 گوگل قادر به هضم 700000 کلمه در هر لحظه خواهد بود!

وقتی یک بلوک متنی بزرگ را به چت ربات‌های هوش مصنوعی مانند ChatGPT یا Gemini وارد می‌کنید، سعی می‌کند تا جایی که ممکن است متن را هضم کند، اما اینکه چقدر می‌تواند هضم شود به پنجره زمینه آن بستگی دارد. بنابراین، اگر مکالمه‌ای دارید که شامل 100 هزار کلمه در مدلی است که فقط می‌تواند 28 هزار کلمه را مدیریت کند و سپس شروع به پرسیدن سؤالاتی کنید که نیاز به دانش کامل از کل 100 هزار کلمه مکالمه داشته باشد، آن را طوری تنظیم می‌کنید که شکست بخورد.

تصور کنید فقط 20 دقیقه از یک فیلم یک ساعته را تماشا می کنید اما از شما خواسته می شود که کل فیلم را توضیح دهید. نتایج شما چقدر خوب خواهد بود؟ شما یا از پاسخ دادن امتناع می‌کنید یا به سادگی چیزهایی درست می‌کنید، این دقیقاً همان کاری است که یک چت ربات هوش مصنوعی انجام می‌دهد و منجر به توهمات هوش مصنوعی می‌شود.

مطلب مرتبط: شارژر سریع من ارزشش را نداشت و کاش زودتر این موضوع را درک می‌کردم.

حال، اگر فکر می‌کنید که هرگز مجبور نبوده‌اید 100 هزار کلمه را به یک ربات چت وارد کنید، این همه چیز نیست. پنجره زمینه فقط از متنی که شما به یک مدل هوش مصنوعی در یک اعلان می‌دهید فراتر می‌رود. مدل‌های هوش مصنوعی کل مکالمه‌ای که در طول یک جلسه چت داشته‌اید را در نظر می‌گیرند تا اطمینان حاصل کنند که پاسخ‌هایشان تا حد امکان مرتبط است.

بنابراین، حتی اگر یک کتاب 100 هزار کلمه ای به آن نمی دهید، مکالمات پشت سر هم و پاسخ هایی که ارائه می دهد، همگی به محاسبه پنجره زمینه می افزایند. تعجب می کنید که چرا ChatGPT یا Gemini گوگل همیشه چیزهایی را که قبلا در یک مکالمه به آن گفته اید فراموش می کند؟ احتمالاً فضای پنجره زمینه تمام شده و شروع به فراموش کردن مطالب کرده است.

یک پنجره زمینه بزرگتر به ویژه برای کارهایی که نیاز به درک عمیق زمینه دارند، مانند خلاصه کردن مقالات طولانی، پاسخ به سؤالات پیچیده یا حفظ یک روایت منسجم در متن تولید شده، مهم است. آیا می خواهید رمانی 50 هزار کلمه ای بنویسید که روایتی ثابت در سرتاسر آن داشته باشد؟ مدلی می‌خواهید که بتواند در یک فایل ویدیویی یک ساعته به سؤالات «تماشا» و پاسخ دهد؟ شما به یک پنجره زمینه بزرگتر نیاز دارید!

به طور خلاصه، پنجره زمینه بزرگتر Gemini 1.5 ممکن است به طور قابل توجهی عملکرد مدل هوش مصنوعی خود را بهبود بخشد، توهم را کاهش دهد و دقت و توانایی برای پیروی بهتر دستورالعمل ها را به طور قابل توجهی افزایش دهد.

مطلب مرتبط: شما احتمالاً بدون اینکه متوجه شوید به موسیقی AI گوش می دهید - در اینجا چگونه آن را مشخص کنید

آیا Gemini 1.5 مطابق انتظارات خواهد بود؟

اگر همه چیز طبق برنامه پیش برود، Gemini 1.5 به طور بالقوه می تواند از بهترین مدل های هوش مصنوعی در بازار بهتر عمل کند. با این حال، با توجه به شکست‌های زیاد گوگل در ساخت یک مدل هوش مصنوعی پایدار، مهم است که احتیاط کنید. بالا بردن پنجره زمینه یک مدل به تنهایی به طور خودکار مدل را بهتر نمی کند.

من از پنجره زمینه 200k کلود 2.1 ماه ها از زمان انتشار آن استفاده کرده ام، و یک چیز برای من واضح است – یک پنجره زمینه بزرگتر در واقع می تواند حساسیت زمینه را بهبود بخشد، اما مشکلات مربوط به عملکرد مدل اصلی می تواند زمینه بزرگتر را مشکل آن کند. خود.

آیا Google Gemini 1.5 تغییر دهنده بازی به ما می دهد؟ رسانه‌های اجتماعی در حال حاضر مملو از بررسی‌های درخشان Gemini 1.5 از سوی کاربرانی است که دسترسی اولیه دارند. با این حال، بیشتر بررسی های 5 ستاره از موارد استفاده عجولانه یا ساده ناشی می شود. یک مکان خوب برای بررسی عملکرد Gemini 1.5 در طبیعت، داخل گزارش فنی Gemini 1.5 گوگل [PDF] است. این گزارش نشان می‌دهد که حتی در طی «آزمایش کنترل‌شده»، این مدل نمی‌تواند تمام جزئیات کوچک اسناد را در اندازه پنجره زمینه خود بازیابی کند.

یک پنجره زمینه یک میلیون رمزی در واقع یک شاهکار فنی چشمگیر است، اما بدون اینکه بتوان جزئیات یک سند را به طور قابل اعتماد بازیابی کرد، پس یک پنجره زمینه بزرگتر ارزش عملی کمی دارد و حتی می تواند دلیلی برای کاهش دقت و توهم باشد.

Tags: چت بات چت جی پی تی گوگل هوش مصنوعی