مدل هوش مصنوعی جمینی گوگل که مدت ها در انتظارش بود بالاخره آمد، اما آیا می تواند GPT-4 OpenAI را از تخت بیاندازد؟
خلاصه عناوین
- مدل هوش مصنوعی جمینی گوگل چیست؟
- نحوه استفاده از هوش مصنوعی گوگل جمینی
- چگونه Gemini با GPT-3.5 و GPT-4 مقایسه می شود
- آیا Gemini بهتر از ChatGPT است؟
نکات کلیدی
- جمینی مدل هوش مصنوعی گوگل دارای سه نوع Ultra، Pro و Nano است که بر روی وظایف و سطوح پیچیدگی مختلف تمرکز دارد.
- Gemini Ultra نتایج امیدوارکنندهای را در معیارهای کلیدی هوش مصنوعی نشان میدهد، اما از دسامبر 2023، برای استفاده عمومی در دسترس نیست. گوگل می گوید باید در ژانویه 2024 در دسترس باشد.
- Gemini Pro در دسترس است و در حالی که عملکرد بسیار خوبی دارد، در حال حاضر نتوانسته GPT-4 را از سلطنت خلع کند.
گوگل به طور مداوم قول داده است که مدل هوش مصنوعی Gemini آن بهتر از GPT-4 OpenAI است، مدلی که ChatGPT Plus را تقویت می کند. اکنون که Google Gemini راه اندازی شده است، می توانیم در نهایت آن را آزمایش کنیم و ببینیم Gemini چگونه با GPT-4 مقایسه می شود.
وقتی Google Bard را در مارس 2023 راه اندازی کرد، دلایل زیادی برای هیجان زده شدن وجود داشت. در نهایت، انحصار ChatGPT OpenAI شکسته خواهد شد و ما رقابت شایسته ای خواهیم داشت.
اما بارد هرگز آن غولهایی نبود که مردم به آن امید داشتند و GPT-4 همچنان پلتفرم ربات چت هوش مصنوعی مولد غالب است. اکنون Gemini گوگل اینجاست، اما آیا مدل هوش مصنوعی مورد انتظار بهتر از ChatGPT است؟
مدل هوش مصنوعی جمینی گوگل چیست؟
جمینی تواناترین مدل هوش مصنوعی مولد گوگل است که قادر به درک و عملکرد در قالب های مختلف داده، از جمله متن، صدا، تصویر و ویدئو است. این تلاش گوگل برای ایجاد یک مدل هوش مصنوعی یکپارچه از قابلیتهای ترسیمی از توانمندترین فناوریهای هوش مصنوعی است. Gemini در سه نوع موجود خواهد بود:
- Gemini Ultra: بزرگترین و تواناترین نوع طراحی شده برای انجام کارهای بسیار پیچیده.
- Gemini Pro: بهترین مدل برای مقیاسبندی و ارائه عملکرد بالا در طیف وسیعی از وظایف، اما نسبت به Ultra توانایی کمتری دارد.
- Gemini Nano: کارآمدترین مدل طراحی شده برای استقرار وظایف بر روی دستگاه. برای مثال، توسعهدهندگان میتوانند از Gemini Nano برای ساخت اپلیکیشنهای موبایل یا سیستمهای یکپارچه استفاده کنند و هوش مصنوعی قدرتمندی را وارد فضای موبایل کنند.
گوگل در وبلاگ رسمی خود، کلمه کلیدی، میگوید که Gemini Ultra در چندین معیار از پیشرفتهترین فناوریها بهتر عمل میکند. گوگل ادعا می کند که Gemini Ultra در چندین معیار کلیدی GPT-4 پیشرو در صنعت را شکست می دهد.
گوگل میگوید Gemini Ultra با امتیاز بیسابقه ۹۰ درصدی در معیار دقیق MMLU، اولین مدلی است که در این آزمایش چند وجهی که ۵۷ سوژه را در بر میگیرد، از عملکرد سطح انسانی پیشی گرفته است.
Gemini Ultra همچنین میتواند کدهای با کیفیت بالا را در برخی از محبوبترین زبانهای برنامهنویسی جهان از جمله Go، JavaScript، Python، Java و C++ درک کند، توضیح دهد و تولید کند. روی کاغذ، همه اینها نتایج عالی هستند. اما اینها همه معیار هستند و معیارها همیشه کل داستان را بیان نمی کنند. بنابراین، Gemini در کارهای دنیای واقعی چقدر خوب عمل می کند؟
نحوه استفاده از هوش مصنوعی گوگل جمینی
از بین سه نوع مدل Gemini AI، می توانید از همین الان استفاده از Gemini Pro را شروع کنید. Gemini Pro در حال حاضر در چت ربات Bard Google در دسترس است. برای استفاده از Gemini Pro با Bard، به bard.google.com بروید و با حساب Google خود وارد شوید.
گوگل می گوید که Gemini Ultra در ژانویه 2024 عرضه می شود، بنابراین فعلاً باید به آزمایش Gemini Pro در برابر ChatGPT بسنده کنیم.
چگونه Gemini با GPT-3.5 و GPT-4 مقایسه می شود
هنگامی که هر مدل هوش مصنوعی جدیدی راه اندازی می شود، در برابر مدل های هوش مصنوعی GPT OpenAI آزمایش می شود، که به طور کلی به عنوان مدلی پیشرفته پذیرفته شده است که سایر مدل ها باید در برابر آن مقاومت کنند. بنابراین، با استفاده از Bard و ChatGPT، توانایی Gemini را در ریاضیات، نوشتن خلاقانه، تولید کد و پردازش دقیق ورودی های تصویر آزمایش کردیم.
با شروع سادهترین سوال ریاضی که میتوانستیم به آن فکر کنیم، از هر دو ربات چت خواستیم که حل کنند: -1 x -1 x -1.
بارد اول رفت. ما سوال را دو بار تکرار کردیم، همه با پاسخ های اشتباه برگشتیم. ما در تلاش سوم جواب گرفتیم، اما این به حساب نمی آید.
ما ChatGPT را روی GPT-3.5 اجرا کردیم. اولین آزمایش درست شد.
برای آزمایش تواناییهای Gemini در تفسیر تصویر، ما آن را به تفسیر برخی از میمهای محبوب واداشتیم. آن را رد کرد و گفت که نمی تواند تصاویر با افراد موجود در آن را تفسیر کند. ChatGPT که GPT-4V را اجرا میکرد، میخواست و میتوانست این کار را بدون نقص انجام دهد.
ما تلاش دیگری را انجام دادیم تا تصویر را تفسیر کنیم و در عین حال توانایی حل مسئله و کدگذاری آن را آزمایش کنیم. ما به Bard که Gemini Pro را اجرا میکرد، یک اسکرین شات دادیم و از آن خواستیم کدهای HTML و CSS را تفسیر و بنویسد تا اسکرین شات را تکرار کند.
این اسکرین شات منبع است.
در زیر تلاش Gemini Pro برای تفسیر و تکرار اسکرین شات با استفاده از HTML و CSS آمده است.
و در اینجا تلاش GPT-4 برای تکرار اسکرین شات است. نتیجه تعجب آور نیست، با توجه به اینکه GPT-4 از لحاظ تاریخی در کدنویسی قوی بوده است. ما قبلا استفاده از GPT-4 را برای ساختن یک برنامه وب از ابتدا نشان داده ایم.
ما از Gemini Pro خواستیم که شعری در مورد تسلا (مارک خودروهای الکتریکی) بسازد. این پیشرفتهای جزئی را نسبت به آزمایشهای قبلی که در گذشته انجام دادهایم نشان داد. نتیجه این است:
در این مرحله، ما فکر کردیم که مقایسه نتایج با GPT-3.5 به جای GPT-4 سوپرشارژ مناسب تر باشد. بنابراین، ما از ChatGPT خواستیم که GPT-3.5 را اجرا کند تا شعری مشابه بسازد.
ممکن است این یک انتخاب شخصی باشد، اما برداشت Gemini Pro در این مورد بهتر به نظر می رسد. اما ما به شما اجازه قضاوت می دهیم.
آیا Gemini بهتر از ChatGPT است؟
قبل از اینکه Google Bard را راهاندازی کند، فکر میکردیم این رقابت ChatGPT است که منتظرش بودیم – اینطور نبود. اکنون، Gemini اینجاست، و تا کنون، Gemini Pro به نظر نمی رسد مدلی باشد که به ChatGPT ضربه ناک اوت بدهد.
گوگل می گوید Gemini Ultra بسیار بهتر خواهد بود. ما واقعاً امیدواریم که اینطور باشد و با ادعاهای مطرح شده در اعلامیه Gemini Ultra مطابقت داشته باشد یا از آن فراتر رود. اما تا زمانی که بهترین نسخه ابزار هوش مصنوعی مولد گوگل را نبینیم و آزمایش نکنیم، نمیدانیم که آیا این ابزار میتواند سایر رقبای مدل هوش مصنوعی را شکست دهد یا خیر. همانطور که مطرح می شود، GPT-4 قهرمان بی چون و چرای مدل هوش مصنوعی باقی می ماند.