این برای ابزارهای تشخیص هوش مصنوعی روز به روز دشوارتر می شود و به نظر نمی رسد به این زودی تغییر کند.
چت ربات های هوش مصنوعی بدون شک ابزارهای قدرتمند و مفیدی هستند. با این حال، توانایی تمایز بین محتوای تولید شده توسط انسان و AI در حال تبدیل شدن به یک موضوع برجسته است.
برای رفع این مشکل، ابزارهایی مانند ZeroGPT پدید آمده اند. اینها برای تمایز بین هوش مصنوعی و محتوای تولید شده توسط انسان طراحی شده اند. اما آیا آنها کار می کنند؟
بیایید نگاهی دقیقتر به ابزارهای تشخیص هوش مصنوعی بیندازیم و ببینیم آیا آنها میتوانند تفاوت بین متن تولید شده توسط انسان و AI را تشخیص دهند.
تست ابزارهای تشخیص هوش مصنوعی
می گویند دلیل پودینگ در خوردن است. بنابراین، بیایید چند آزمایش را امتحان کنیم و ببینیم این ابزار چقدر موثر هستند. آزمایش هر ابزار غیرممکن است، بنابراین ما در حال آزمایش یکی از محبوب ترین ابزارها هستیم – ZeroGPT.
برای مطالب، ما فکر میکنیم بسیار سرگرمکننده است که ChatGPT را در نوشتن مقدمه برای این مقاله و سپس مقایسه آن با مقدمه «تولید شده توسط انسان» بررسی کنیم:
تست اول: مقایسه مقدمه مقاله انسان و هوش مصنوعی
اولین کاری که انجام دادیم این بود که ChatGPT را برای ایجاد یک مقدمه دریافت کردیم. عنوان را وارد کردیم و اطلاعات بیشتری به آن ندادیم. برای ثبت، ما از GPT-3.5 برای آزمایش استفاده کردیم.
سپس متن را کپی کرده و در ZeroGPT قرار دادیم. همانطور که می بینید، نتایج کمتر از ستاره ای بود.
شروع نامشخصی است، اما نشان می دهد که چت ربات های هوش مصنوعی چقدر موثر هستند. برای تکمیل تست، به ZeroGPT اجازه می دهیم پیش نویس ایجاد شده توسط انسان را تجزیه و تحلیل کند.
حداقل این قسمت را درست بیان کرد. به طور کلی، ZeroGPT در این دور شکست خورد. مشخص کرد که حداقل بخشی از معرفی ایجاد شده توسط هوش مصنوعی مشکوک بود اما نتوانست مسائل خاصی را برجسته کند.
تست دوم: مسئله مثبت کاذب
با افزایش استفاده از ChatGPT و سایر ابزارهای هوش مصنوعی، احتمال دانستن یا شنیدن در مورد شخصی که با ادعاهایی مبنی بر اینکه کار آنها توسط هوش مصنوعی تولید شده است، افزایش می یابد. این اتهامات یکی از مشکلات جدیتر ChatGPT و ابزارهای تشخیص هوش مصنوعی مانند ZeroGPT است، زیرا این نوع خطا میتواند به شهرت آسیب برساند و بر معیشت افراد تأثیر بگذارد.
موارد مثبت کاذب زمانی اتفاق میافتد که محتوای تولید شده توسط انسان به اشتباه بهعنوان کار هوش مصنوعی علامتگذاری شود. همانطور که مثال زیر نشان می دهد، مشکل به راحتی تکرار می شود. من یک ماهیگیر مشتاق هستم، بنابراین تصمیم گرفتم مقدمه ای برای یک مقاله خیالی در مورد ماهیگیری در فلوریدا بنویسم. سپس به ZeroGPT اجازه دادم متن را تجزیه و تحلیل کند – نشان داد که متن 100٪ با هوش مصنوعی تولید شده است.
انصافاً هدفم این بود. من متن را عمومی نگه داشتم و از زبان “فروش” استفاده کردم. اما نکته ای که یک انسان این را نوشته است به همان اندازه معتبر است. این یک ناراحتی یا چیزی نیست که فقط بتوان از آن چشم پوشی کرد. خطاهایی مانند این می تواند عواقب جدی برای نویسندگان، دانش آموزان و سایر متخصصانی که آثار مکتوب ایجاد می کنند داشته باشد.
تست سوم: تست ZeroGPT در داستان
برای تست سوم، میخواهیم از ChatGPT استفاده کنیم و از آن بخواهیم داستانی بنویسد. برای انجام این کار، ما یک سناریو ایجاد کردیم و ChatGPT را ترغیب کردیم تا مقدمه ای کوتاه برای یک داستان تخیلی بنویسد.
ما آن را ساده نگه داشتیم و فقط خواستیم مقدمه ای برای داستانی درباره دو غریبه بنویسیم که در سکوی راه آهن با هم ملاقات می کنند:
و در اینجا پاسخ ZeroGPT بود:
همانطور که از نتیجه مشخص است، ZeroGPT قادر به تشخیص واقعیت از داستان در هنگام برخورد با داستان نیست!
تست چهارم: مقالات خبری
چیزی ناراحت کننده در مورد هوش مصنوعی وجود دارد که می تواند ما را از آنچه در دنیای اطراف ما اتفاق می افتد آگاه کند. این لزوماً همیشه “خبر جعلی” نیست، زیرا می تواند مرتبط و آموزنده باشد، اما نگرانی های اخلاقی قطعی در مورد هوش مصنوعی وجود دارد.
در مورد ZeroGPT منصفانه، در این تست عملکرد خوبی داشت. ما از ChatGPT و Bing Chat خواستیم که مقالات خبری در مورد چندین موضوع بنویسند و ZeroGPT هر بار آن را ثابت می کند. مثال زیر نشان میدهد که به درستی مقاله تولید شده توسط Bing Chat را بهعنوان 100% تولید شده توسط هوش مصنوعی اعلام میکند.
این ابزار بهطور پیوسته هر مقاله خبری را بهعنوان تولیدشده توسط هوش مصنوعی پرچمگذاری میکرد که تصمیم گرفتیم آن را روی یک مقاله خبری ساختگی که به همین منظور نوشتیم آزمایش کنیم.
حداقل برخی از مقالات را بهعنوان تولید شده توسط انسان شناسایی کرد، اما بیش از 70 درصد آنها را بهعنوان تولیدشده توسط هوش مصنوعی علامتگذاری کرد. باز هم، ما باید در اینجا منصف باشیم. این یک هش مجدد نسبتاً ابتدایی مقاله بینگ بود و به سختی کیفیت جایزه پولیتزر را داشت.
اما نکته همچنان پابرجاست. این توسط یک انسان با استفاده از تحقیقاتی که در اینترنت یافت شده نوشته شده است.
چرا ابزارهای تشخیص هوش مصنوعی خیلی خوب نیستند؟
هیچ دلیل واحدی پشت نقص ابزارهایی مانند ZeroGPT وجود ندارد. با این حال، یک مشکل اساسی کارآمدی چت ربات های مولد هوش مصنوعی است. اینها نشان دهنده یک فناوری فوق العاده قدرتمند و به سرعت در حال تکامل هستند که به طور موثر آنها را به هدف متحرکی برای ابزارهای تشخیص هوش مصنوعی تبدیل می کند.
چت ربات های هوش مصنوعی به طور مداوم در حال بهبود کیفیت و «انسان بودن» خروجی خود هستند و این کار را بسیار چالش برانگیز می کند. با این حال، صرف نظر از مشکلات، طرف AI معادله باید بدون نظارت انسان قضاوت کند.
ابزارهایی مانند ZeroGPT از هوش مصنوعی برای تعیین تصمیم خود استفاده می کنند. اما هوش مصنوعی فقط صبح ها از خواب بیدار نمی شود و می داند چه کاری انجام دهد. باید آموزش داده شود و اینجاست که جنبه فنی معادله مطرح می شود.
تعصبات الگوریتمی و دادههای آموزشی با توجه به اندازه مدلهای زبان بزرگی که این ابزارها بر روی آنها آموزش داده شدهاند، اجتنابناپذیر هستند. این مشکلی نیست که محدود به ابزارهای تشخیص هوش مصنوعی باشد، همین تعصبات می تواند باعث شود چت ربات های هوش مصنوعی پاسخ های نادرست و توهمات هوش مصنوعی ایجاد کنند.
با این حال، این خطاها خود را به عنوان “پرچم های AI” نادرست در ابزارهای تشخیص نشان می دهند. این به سختی ایده آل است، اما بازتابی از وضعیت فعلی فناوری هوش مصنوعی است. سوگیری های ذاتی در داده های آموزشی می تواند به مثبت کاذب یا منفی کاذب منجر شود.
عامل دیگری که باید در نظر گرفته شود این است که محتوای تولید شده توسط هوش مصنوعی چیست. اگر محتوای تولید شده توسط هوش مصنوعی به سادگی بازنویسی شود، آیا محتوای تولید شده توسط هوش مصنوعی است یا انسان؟ این یک چالش بزرگ دیگر است – محو شدن خطوط بین این دو، تعریف محتوای ایجاد شده توسط ماشین را تقریبا غیرممکن می کند.
به دنبال آینده تشخیص هوش مصنوعی
این ممکن است به نظر برسد که ما در حال ضربه زدن به ابزارهایی مانند ZeroGPT هستیم. این مورد نیست؛ آنها با چالش های بزرگی روبرو هستند و این فناوری به سختی از پوشک استفاده می کند. جذب سریع ابزارهایی مانند ChatGPT تقاضایی برای تشخیص هوش مصنوعی ایجاد کرده است و باید به این فناوری فرصتی برای بلوغ و یادگیری داده شود.
نمی توان انتظار داشت که این ابزارها به تنهایی با چالش های ایجاد شده توسط چت بات ها روبرو شوند. اما آنها می توانند نقش ارزشمندی را در یک تلاش هماهنگ و چند وجهی برای مقابله با چالش های هوش مصنوعی ایفا کنند. آنها بخشی از یک پازل بزرگتر را نشان می دهند که شامل شیوه های اخلاقی هوش مصنوعی، نظارت انسانی، و تحقیق و توسعه مداوم است.
چالشهایی که این ابزارها با آنها روبرو هستند، آینهای از چالشهایی هستند که جامعه با معضلات مرتبط با عصر فناوری جدید دست و پنجه نرم میکند.
هوش مصنوعی یا نه؟ مساله این است
ابزارهایی مانند ZeroGPT ناقص هستند، در این شکی نیست. اما آنها بیارزش نیستند و نشاندهنده یک گام مهم در تلاش برای مدیریت و تنظیم هوش مصنوعی هستند. دقت آنها بهتر خواهد شد، اما پیچیدگی هوش مصنوعی که آنها برای شناسایی آموزش دیده اند نیز بهبود خواهد یافت. جایی در میانه این مسابقه تسلیحاتی، باید تعادلی پیدا کنیم که جامعه با آن راحت باشد.
سوال: هوش مصنوعی یا نه؟ چیزی بیش از صرفاً بحث در مورد اینکه آیا چیزی توسط هوش مصنوعی تولید شده است یا خیر. این نشاندهنده پرسشهای بزرگتری است که جامعه با انطباق با دنیای جدید و شجاع هوش مصنوعی با آن مواجه است.
برای ثبت، و با توجه به ZeroGPT، 27.21 درصد از این نتیجه گیری توسط هوش مصنوعی ایجاد شده است. هوم