chatgpt اکنون می تواند با استفاده از تصاویری که بارگذاری می کنید دلیل آن را دلیل دهید: چرا این شگفت انگیز است

در 16 آوریل 2025 ، Openai دو مدل استدلال جدید هوش مصنوعی-O3 و O4-Mini را معرفی کرد. اینها نشان دهنده پرش قابل توجهی در قابلیت های هوش مصنوعی شرکت است ، که شاید در هیچ کجا مشهودتر از قابلیت های استدلال تصویر جدید آنها باشد.

این مدل های جدید می توانند با تصاویر “فکر” کنند

OpenAi می گوید این مدل های جدید می توانند هر تصویری را که بارگذاری می کنید ، مانند یک طرح تخته سفید ، نمودارهای کتاب درسی یا یک PDF گرافیکی تفسیر کنند. اعلامیه انتشار Openai O3 و O4-Mini می گوید:

آنها فقط تصویری را نمی بینند – آنها با آن فکر می کنند. این یک کلاس جدید از حل مسئله را باز می کند که استدلال بصری و متنی را در هم می آمیزد ، که در عملکرد پیشرفته آنها در معیارهای چند مدلی منعکس شده است.

تجزیه و تحلیل تصویر در زنجیره ای از استدلال اندیشه انجام شده توسط مدل ها گنجانده شده است. مدل های AI می توانند تصاویر را بزرگنمایی ، چرخش یا محصول برای بهبود پردازش خود داشته باشند. و آنها به همان اندازه با تصاویر با کیفیت پایین مهارت دارند.

به عنوان مثال ، هنگام حل یک مشکل علمی مربوط به یک نمودار ، این مدل ممکن است به بخش خاصی از تصویر بزرگنمایی کند ، محاسبات را با پایتون اجرا کند و سپس یک نمودار برای توضیح یافته های آن ایجاد کند.

مطلب مرتبط: نقض داده های سامسونگ، دکمه ویرایش توییتر، ترفندهای بازنشانی ویندوز، اسرار اپلیکیشن موبایل دیزنی+

در حالی که استدلال می کند ، O3 و O4-Mini می توانند به صورت پویا از تمام ابزارهای چتپپ موجود ، از جمله مرور وب ، اجرای کد پایتون و تولید تصویر استفاده کنند. این قابلیت عامل به آنها اجازه می دهد تا به طور خودکار از ابزار ایده آل chatgpt برای یک کار خاص استفاده کنند. کاربران و توسعه دهندگان می توانند گردش کار چند مرحله ای را اجرا کنند و کارهای پیچیده ای را برطرف کنند.

O4-Mini-High نوعی O4-Mini است که برای هر فوری برای ارائه نتایج با کیفیت بالاتر ، زمان و تلاش محاسباتی بیشتری را صرف می کند. برخی از سناریوهای روزمره می توانند:

تولید و ارزیابی مطالعات در زمینه زیست شناسی ، مهندسی و سایر زمینه های STEM ، ارائه استدلال گام به گام و توضیحات بصری.
جستجوی و جمع آوری اطلاعات از منابع متعدد ، مانند بانکهای اطلاعاتی آنلاین ، گزارش های مالی ، داده های بازار و نمودارها ، برای تولید بینش تجاری.

این مدل ها از طریق یادگیری تقویت شده (یک مفهوم کلیدی در هوش مصنوعی) آموزش دیده اند. اکنون ، آنها می توانند مشکلات فازی را بهتر کنترل کنند ، زیرا می توانند دلیل استفاده از یک ابزار خاص برای نتیجه مطلوب را استدلال کنند.

مدل های O3 ، O4-Mini و O4-Mini با حساب های Chatgpt Plus ، Pro و Team در دسترس همه هستند و انتظار می رود O3-PRO در هفته های آینده راه اندازی شود. می توانید آنها را در منوی Model Selector مشاهده کنید.

کاربران رایگان می توانند با انتخاب گزینه Think در آهنگساز قبل از ارسال درخواست های خود ، با مدل O4-Mini آزمایش کنند.

مطلب مرتبط: من بالاخره به پادکست تولید شده توسط هوش مصنوعی Spotify گوش دادم و کمی خسته کننده است

چرا قابلیت های چندمادی چتپپ می تواند شگفت انگیز باشد

مدل های جدید Openai با فعال کردن هوش مصنوعی به “فکر کردن با تصاویر” ، می توانند با مشکلات دنیای واقعی که نیاز به تفسیر متن و تصویری دارند ، برطرف شود. این شامل اشکال زدایی کد از تصاویر ، خواندن متن دست نوشته ، تجزیه و تحلیل نمودارهای علمی یا استخراج بینش از نمودارهای پیچیده است. نتیجه؟ Chatgpt بیشتر آگاه تر شده است.

اکنون مدل ها خودمختار تر هستند. آنها همچنین ممکن است کارآمدتر باشند ، به طور مستقل یک مدل خاص را با یک کار قرار می دهند. از آنجا که این عوامل هوش مصنوعی خودمختار می توانند وظایف پیچیده و چند مرحله ای را بر عهده بگیرند ، قابلیت های استدلال و هوش بصری آنها را برای زمینه هایی مانند تحقیق ، تجارت و کار خلاقانه بسیار مهم می کند.

Tags: openai چت جی پی تی