5 بهترین ویژگی جدید GPT-4 توضیح داده شده است

GPT-4 اینجاست، و اینها ویژگی های جدیدی هستند که باید بررسی کنید.

OpenAI سرانجام به روز رسانی مورد انتظار GPT خود را با نام GPT-4 راه اندازی کرد. مدل زبان بزرگ (LLM) با برخی ویژگی‌ها و قابلیت‌های قدرتمند جدید ارائه می‌شود که کاربران را در سراسر جهان شوکه کرده است.

علاوه بر اینکه GPT-4 به طور قابل توجهی بهتر از GPT-3.5 است، LLM موجود که ربات چت ویروسی OpenAI ChatGPT را تقویت می کند، GPT-4 می تواند ورودی های پیچیده تری را درک کند، دارای محدودیت ورودی کاراکتر به مراتب بزرگتر است، دارای قابلیت های چندوجهی است، و طبق گزارش ها استفاده از آن ایمن تر است.

1. GPT-4 می تواند ورودی های پیچیده تری را درک کند

یکی از بزرگترین ویژگی های جدید GPT-4 توانایی آن در درک اعلان های پیچیده تر و ظریف تر است. طبق گفته OpenAI، GPT-4 “عملکرد در سطح انسانی را در معیارهای مختلف حرفه ای و آکادمیک نشان می دهد.”

این امر با قرار دادن GPT-4 از طریق چندین آزمون در سطح انسانی و تست های استاندارد شده، مانند SAT، BAR، و GRE، بدون آموزش خاص، نشان داده شد. GTP-4 نه تنها این تست‌ها را با نمره نسبتاً بالا در سراسر تخته درک و حل کرد، بلکه هر بار نسخه قبلی خود یعنی GPT-3.5 را شکست داد.

توانایی درک اعلان‌های ورودی ظریف‌تر نیز با این واقعیت کمک می‌کند که GPT-4 دارای محدودیت کلمات بسیار بزرگ‌تری است. مدل جدید می‌تواند اعلان‌های ورودی تا 25000 کلمه را مدیریت کند (برای زمینه، GPT-3.5 به 8000 کلمه محدود شده بود). این به طور مستقیم بر جزئیاتی که کاربران می‌توانند در اعلان‌های خود فشار دهند تأثیر می‌گذارد، از این رو به مدل اطلاعات بسیار بیشتری برای کار کردن و تولید خروجی‌های طولانی‌تر می‌دهد.

GPT-4 همچنین از بیش از 26 زبان از جمله زبان های کم منبع مانند لتونی، ولزی و سواحیلی پشتیبانی می کند. هنگامی که در معیار MMLU بر روی دقت سه شلیک محک زده شد، GPT-4 از نظر عملکرد انگلیسی زبان در 24 زبان، GPT-3.5 و همچنین سایر LLM های پیشرو مانند PaLM و Chinchilla را شکست داد.

مطلب مرتبط: این هوش مصنوعی می‌تواند لهجه شما را حدس بزند و به طرز وحشتناکی دقیق است

2. قابلیت های چندوجهی

نسخه قبلی ChatGPT فقط به پیام های متنی محدود بود. در مقابل، یکی از جدیدترین ویژگی های GPT-4 قابلیت های چند وجهی آن است. مدل می تواند هر دو درخواست متن و تصویر را بپذیرد.

این بدان معنی است که هوش مصنوعی می تواند یک تصویر را به عنوان ورودی بپذیرد و آن را درست مانند یک پیام متنی تفسیر و درک کند. این قابلیت شامل همه اندازه ها و انواع تصاویر و متن، از جمله اسناد ترکیبی از این دو، طرح های دستی و حتی اسکرین شات ها می شود.

با این حال، قابلیت‌های خواندن تصویر GPT-4 فراتر از تفسیر ساده آنهاست. OpenAI این را در جریان توسعه دهندگان خود (بالا) به نمایش گذاشت، جایی که آنها GPT-4 را با یک مدل طراحی دستی از یک وب سایت جوک ارائه کردند. این مدل وظیفه داشت کدهای HTML و جاوا اسکریپت را بنویسد تا موکاپ را به یک وب سایت تبدیل کند و در عین حال جوک ها را با جوک های واقعی جایگزین کند.

GPT-4 هنگام استفاده از طرح بندی مشخص شده در ماکت، کد را نوشت. پس از آزمایش، کد یک سایت کاری با، همانطور که می توانید حدس بزنید، جوک های واقعی را تولید کرد. آیا این بدان معناست که پیشرفت های هوش مصنوعی به معنای پایان برنامه نویسی است؟ نه کاملاً، اما همچنان یک ویژگی است که در کمک به برنامه نویسان مفید خواهد بود.

همانطور که این ویژگی امیدوارکننده به نظر می رسد، هنوز در پیش نمایش تحقیقاتی است و به صورت عمومی در دسترس نیست. علاوه بر این، این مدل برای پردازش ورودی‌های بصری زمان زیادی را صرف می‌کند، با خود OpenAI بیان می‌کند که برای سریع‌تر شدن ممکن است کار و زمان صرف شود.

مطلب مرتبط: من پس از یادگیری این ۵ ترفند ساده برای طولانی‌ کردن عمر، تعویض لوازم جانبی را متوقف کردم.

3. فرمان پذیری بیشتر

OpenAI همچنین ادعا می کند که GPT-4 دارای درجه بالایی از فرمان پذیری است. همچنین شکستن کاراکترها را برای هوش مصنوعی سخت‌تر کرده است، به این معنی که هنگام اجرای یک برنامه برای بازی یک شخصیت خاص، احتمال شکست آن کمتر است.

توسعه دهندگان می توانند سبک و وظیفه هوش مصنوعی خود را با توصیف جهت در پیام “سیستم” تجویز کنند. این پیام‌ها به کاربران API اجازه می‌دهند تا تجربه کاربر را در محدوده‌های خاصی به شدت سفارشی کنند. از آنجایی که این پیام‌ها ساده‌ترین راه برای «جیل‌بریک» مدل هستند، آن‌ها همچنین در حال کار روی امن‌تر کردن آن‌ها هستند. نسخه ی نمایشی GPT-4 این نکته را با واداشتن کاربر به تلاش برای متوقف کردن GPT-4 از معلم سقراطی و پاسخ دادن به درخواست آنها به پایان رساند. با این حال، این مدل از شکستن شخصیت خودداری کرد.

4. ایمنی

OpenAI شش ماه را صرف ساخت GPT-4 ایمن تر و هماهنگ تر کرد. این شرکت ادعا می‌کند که 82 درصد کمتر به درخواست‌های محتوای نامناسب یا غیرمجاز پاسخ می‌دهد، 29 درصد بیشتر احتمال دارد که مطابق با سیاست‌های OpenAI به درخواست‌های حساس پاسخ دهد و 40 درصد بیشتر احتمال دارد که پاسخ‌های واقعی را در مقایسه با GPT-3.5 ارائه کند. .

این کامل نیست، و شما هنوز هم می توانید انتظار داشته باشید که هر از گاهی “توهم” کند و ممکن است در پیش بینی های خود اشتباه کند. مطمئناً GPT-4 ادراک و قدرت پیش‌بینی بهتری دارد، اما همچنان نباید کورکورانه به هوش مصنوعی اعتماد کنید.

5. بهبود عملکرد

خارج از ارزیابی عملکرد مدل در امتحانات انسانی، OpenAI همچنین ربات را بر اساس معیارهای سنتی طراحی شده برای مدل‌های یادگیری ماشین ارزیابی کرد.

مطلب مرتبط: 3 راه برای ساخت یک بخاری خورشیدی استخر DIY

ادعا می‌کند که GPT-4 «به‌طور قابل‌توجهی بهتر از LLM‌های موجود و «بیش‌ترین مدل‌های پیشرفته» عمل می‌کند. این معیارها شامل MMLU، AI2 Reasoning Challenge (ARC)، WinoGrande، HumanEval و Drop فوق الذکر هستند که همگی قابلیت های فردی را آزمایش می کنند.

هنگام مقایسه عملکرد در معیارهای بینایی تحصیلی، نتایج مشابهی خواهید یافت. تست‌های اجرا شده شامل VQAv2، TextVQA، ChartQA، AI2 Diagram (AI2D)، DocVQA، Infographic VQA، TVQA و LSMDC هستند که همگی GPT-4 در صدر هستند. با این حال، OpenAI اعلام کرده است که نتایج GPT-4 در این آزمایش‌ها «به طور کامل میزان توانایی‌های آن را نشان نمی‌دهد» زیرا محققان به یافتن چیزهای جدید و چالش‌برانگیزتری ادامه می‌دهند که مدل می‌تواند با آنها مقابله کند.

Small Step برای GPT-4، Giant Leap برای هوش مصنوعی

با دقت بیشتر، ایمنی استفاده و قابلیت‌های پیشرفته، GPT-4 از طریق طرح اشتراک ماهانه ChatGPT+ با هزینه 20 در ماه برای عموم منتشر شده است. علاوه بر این، OpenAI با سازمان‌های مختلف همکاری کرده است تا شروع به ساخت محصولاتی برای مصرف‌کننده با GPT-4 کند. مایکروسافت بینگ، Duolingo، Stripe، Be My Eyes و Khan Academy، در میان دیگران، قبلاً GPT-4 را در محصولات خود پیاده سازی کرده اند.

GPT-4 ممکن است یک به روز رسانی افزایشی نسبت به GPT-3.5 باشد، اما به طور کلی یک پیروزی بزرگ برای هوش مصنوعی است. از آنجایی که مدل از طریق API آن برای کاربر معمولی و توسعه دهندگان در دسترس تر می شود، به نظر می رسد که مورد خوبی برای پیاده سازی LLM در همه زمینه ها باشد.