آیا سیلورمن نکته ای دارد؟ آیا مدل های هوش مصنوعی حق چاپ را نقض می کنند؟
مدل های هوش مصنوعی مانند ChatGPT و Bard با استفاده از داده های ایجاد شده توسط انسان آموزش داده می شوند. هرچه داده های بیشتری دریافت کنند، در تقلید از هوش و خلاقیت انسان باهوش تر می شوند. بازیگران بزرگ در صنعت هوش مصنوعی، مانند OpenAI و Meta، مدلهای زبان بزرگی را به کار گرفتهاند که با خراش دادن متون و کتابهای موجود آنلاین برای استخراج دادهها آموزش دیدهاند.
به دلیل نحوه آموزش LLM ها، تضاد بین قانون کپی رایت و هوش مصنوعی اجتناب ناپذیر بود. اکنون جوجهها به خانه میآیند تا سارا سیلورمن و دیگر هنرمندان از OpenAI و Meta به دلیل نقض حق چاپ شکایت کنند.
چرا سارا سیلورمن و سایر هنرمندان از Openai و Meta استفاده می کنند؟
سارا سیلورمن کمدین و سایر نویسندگان (کریستوفر گلدن و ریچارد کادری) در یک دادخواست دسته جمعی [PDF] در کالیفرنیا به دنبال جبران خسارت علیه OpenAI و Meta به دلیل نقض حق چاپ هستند. این شکایت ادعا می کند که OpenAI و Meta برای آموزش مدل های هوش مصنوعی خود، کتاب های دارای حق چاپ را از وب سایت های دزدان دریایی حذف کرده اند. این معادل یک مدل هوش مصنوعی است که مجموعه داده های آموزشی خود را بدون پرداخت غرامت به نویسندگان از Piratebay دانلود می کند.
تصادفاً، یک شکایت دسته جمعی جداگانه [PDF] علیه OpenAI ادعا می کند که این شرکت از اطلاعات خصوصی غیرمجاز برای آموزش ChatGPT استفاده کرده است. گوگل همچنین با شکایت مشابهی به دلیل استفاده از داده های سرقت شده برای آموزش Google Bard مواجه است. به همین دلیل است که باید محافظت از اطلاعات شخصی خود را به عادت تبدیل کنید، اگرچه انتشار کار و داده های شخصی خصوصی یکسان نیستند.
شانس اینکه سارا سیلورمن بتواند دعوی را برنده شود چقدر است؟
سیلورمن و دیگر هنرمندان ادعا میکنند که ChatGPT میتواند در صورت درخواست، کتابهایشان را بهطور دقیق خلاصه کند. این شکایت استدلال میکند که اگر مدل هوش مصنوعی به مطالب دارای حق چاپ دسترسی نداشته باشد، این امکان وجود نخواهد داشت. با این حال، اگر ChatGPT با استفاده از میلیاردها متن اینترنتی آموزش داده میشد، احتمالاً با مقالات، نظرات و پستهای رسانههای اجتماعی درباره کتابها بحث میکرد.
علاوه بر این، متا فاش کرد که کتابهایی را که برای آموزش مدل هوش مصنوعی خود استفاده میکرد از کجا به دست آورده است – منبع آن در یک وبسایت تورنت کتاب الکترونیکی ردیابی شده است. به طور مشابه، شکایت دسته جمعی علیه OpenAI همچنین به وبسایتهای غیرقانونی اشاره میکند که در آن OpenAI مشکوک است که مطالب دارای حق چاپ را به دست آورده است، اما OpenAI هنوز منابع آن را تأیید نکرده است.
اگر ثابت شود که OpenAI و Meta از وبسایتهای تورنت غیرقانونی برای به دست آوردن مطالب دارای حق چاپ برای آموزش مدلهای هوش مصنوعی خود استفاده کردهاند، Silverman ممکن است شانس پیروزی در این دعوی را داشته باشد. با این حال، مدلهای هوش مصنوعی قلمروی ناشناخته هستند که هیچ سابقهای برای دادگاهها برای صدور حکمی بر اساس نقض حق نسخهبرداری هوش مصنوعی ندارند. در واقع، این یکی از دلایلی است که اتحادیه اروپا قانون هوش مصنوعی را پیشنهاد کرده است.
آینده مدل های هوش مصنوعی و قانون حق چاپ چیست؟
ما هنوز در روزهای اولیه هوش مصنوعی هستیم تا بدانیم چگونه با قانون کپی رایت سازگار خواهد شد. تلاش برای فهمیدن اینکه چه کسی مالک حق نسخه برداری ایجاد هوش مصنوعی است، پیچیده تر است. اما برای خالقان انسانی، مقرراتی وجود دارد که از آنها در برابر دسترسی دیگران به مطالب دارای حق چاپ آنها بدون غرامت، رضایت یا اعتبار محافظت می کند. اگر قوانین برای انسان ها وجود داشته باشد، آیا این قوانین برای مدل های هوش مصنوعی اعمال می شود؟
پارلمان اتحادیه اروپا نزدیکترین نگاهی به آینده در مورد اینکه چگونه مدلهای هوش مصنوعی با قانون کپی رایت مطابقت خواهند داشت، تهیه کرد. اگر قانون هوش مصنوعی اتحادیه اروپا در قانون تصویب شود، مدلهای هوش مصنوعی مانند ChatGPT و Bard ملزم به انتشار همه منابع دادههای خود و دادههای دارای حق چاپ مورد استفاده برای آموزش خواهند بود. اگر مدلهای هوش مصنوعی از طریق وبسایتهای غیرقانونی دزدی دریایی به کتابها، فیلمها، موسیقی و عکسهای دارای حق چاپ دسترسی داشته باشند، این امر به رفع هرگونه سردرگمی کمک میکند.
حکم دعوی AI کلاس Action یک سابقه قانونی ایجاد خواهد کرد
مدل های زبان بزرگ می توانند تمام گوشه های اینترنت را برای داده های مورد استفاده در آموزش خراش دهند. اما آیا در صورت دسترسی به وبسایتهای تورنت غیرقانونی برای به دست آوردن دادهها، آیا آنها مسئول نقض حق چاپ هستند؟ و اگر این کار را انجام دهند، می توانید آن را ثابت کنید؟
صرف نظر از نتیجه، شکایت های دسته جمعی علیه شرکت های فناوری که دارای محبوب ترین مدل های هوش مصنوعی هستند، سابقه ای را ایجاد خواهد کرد که در آینده مرتبط خواهد بود.