هوش مصنوعی می تواند ما را فریب دهد تا هنر تولید شده را با عکس های واقعی اشتباه بگیریم. پس چرا دست ها چنین چالش بزرگی هستند؟
ژنراتورهای هوش مصنوعی در مقابل چشمان ما با سرعتی ترسناک تکامل مییابند، اما همچنان نقصهایی دارند. مشاهده جزئیات عجیب در تصاویر هوش مصنوعی در واقع بسیار خنده دار است. به همین دلیل است که عقربه های Midjourney به یک موضوع داغ تبدیل شده است، مشکلی که در بسیاری از موتورها رایج است.
بیایید توضیح دهیم که چرا دست ها تولیدکنندگان تصویر هوش مصنوعی را تا این حد به چالش می کشند. برنامه نویسان آنها در حال حاضر در حال رفع این مشکل ارزشمند هستند، اما جالب است که در مورد چگونگی یادگیری هوش مصنوعی فکر کنیم، نه اینکه بدانیم چه چیزی سر راهش قرار می گیرد.
چرا دست های تولید شده توسط هوش مصنوعی به هم ریختند؟
هرکسی که از موتورهای هوش مصنوعی برای ایجاد تصاویر استفاده میکند، ممکن است متوجه شده باشد که دستها به ندرت درست بیرون میآیند، اما با ظاهر شدن دستهای از «عکسها» در توییتر، این مشکل بهشدت تغییر کرد.
با بررسی دقیقتر، دستهای عجیب و غریب مردم آنها را بهعنوان تصاویری که توسط هوش مصنوعی تولید میشوند، به دست میآورند. این واقعیت که این تلاش Midjourney بود، وضعیت را جالبتر کرد.
یکی از بهترین موتورهای هوش مصنوعی در اطراف نمیتوانست با پیچیدگی دست انسان مقابله کند، بنابراین تواناییهای Midjourney و رقبای آن مورد آزمایش قرار گرفتند. درست است، حتی DALL-E نیز مستعد انگشتان و ناخن های غیرواقعی است.
با توجه به اینکه دست های تولید شده توسط هوش مصنوعی همیشه یک مشکل بوده است، تبلیغات نامناسب بود، اما توجه بیشتر باعث شد نسخه Midjourney نسخه 5 بهبود یابد.
نسخه جدید به بهبود طراحی دست اشاره کرد، که نشانگر این بود که مهندسان هوش مصنوعی به این هیجان خنده دار توجه کردند و تصمیم گرفتند قابلیت های نرم افزار را ارتقا دهند.
موتورهای دیگر در پیروی از مثال Midjourney کند هستند، بنابراین اصلاح هنر هوش مصنوعی با فتوشاپ همچنان یک مهارت ارزشمند است. مانع اصلی برای برنامه نویسان این است که آموزش هوش مصنوعی برای کشیدن دست های متقاعد کننده چقدر پیچیده است.
چرا تولیدکنندگان تصویر هوش مصنوعی با دستان خود مبارزه می کنند؟
موتورهای هوش مصنوعی از شبکه های متخاصم مولد (GANs) یا Stable Diffusion برای تولید تصاویر استفاده می کنند. هر دو فناوری برای ایجاد حتی ابتدایی ترین آثار هنری به منابع گسترده، آموزش و قدرت پردازش نیاز دارند.
از آنجایی که تصاویر از قبل موجود در آموزش هوش مصنوعی نقش اساسی دارند، برنامه نویسان باید هزاران، و نه میلیون ها تصویر را در کنار اعلان ها به نرم افزار خود وارد کنند – این فرآیند را بارها و بارها تکرار کنند تا زمانی که موتور بفهمد یک کلمه خاص به چه چیزی اشاره دارد و چگونه آن را نشان دهد. آن شی
اما تصاویر منبعی که یک هوش مصنوعی از آنها میآموزد، عمدتاً دو بعدی هستند، جایی که دستها در موقعیتهای مختلفی به تصویر کشیده میشوند. چه راست باشد چه فر، نشان دادن پنج یا سه انگشت.
در پایان روز، یک ماشین واقعاً مفهوم دستها را نمیفهمد، و تصاویری که از آنها میآموزد همیشه دستها را به وضوح یا به اندازه کافی ثابت نشان نمیدهند. به همین دلیل است که دستهای Midjourney میتوانند بسیار زشت باشند: سردرگمی هوش مصنوعی.
هر چقدر که نگرانی های ایلان ماسک در مورد توسعه هوش مصنوعی معتبر باشد، برخی از بخش های این فناوری هنوز چیزهای زیادی برای یادگیری دارند. و موانع آنها فراتر از نمونه های ناکافی دست است.
دلایل دیگری که چرا تولیدکنندگان تصویر هوش مصنوعی به کندی بهبود می یابند
با نگاهی به مدلهای Midjourney، v5 هماهنگی پیشرفتهای بین پیامهای متنی و تصاویر تولید شده، و همچنین وضوح بالاتر و ابزارهای اضافی ارائه میدهد. اما چنین دستاوردهایی ارزان نیستند.
آموزش هوش مصنوعی برای انجام بهتر کار با دست مستلزم ارائه تصاویر بهتر به ویژه در سه بعدی است. این بدان معناست که زمان و نیروی انسانی زیادی صرف فرآیندها می شود، از دستیابی به منابع منبع گرفته تا بهبود کدنویسی و تکرار آموزش تا زمانی که هوش مصنوعی آن را به درستی انجام دهد.
حتی در این صورت، نرم افزار می تواند در کارهای هنری خیره کننده اشتباه کند. علاوه بر اینکه یک کار بزرگ و پیچیده است، گران است. بنابراین، انتظار نداشته باشید که مولدهای متن به تصویر رایگان هوش مصنوعی هنوز به کالیبر Midjourney پیشرفت کنند.
به زبان ساده، مشکل موتورهای هوش مصنوعی فقط ناتوانی این برنامههای کامپیوتری در درک کامل ویژگیهای انسان مانند دستها و پاها نیست. همچنین به هزینههای آن و دسترسی این فناوری به تصاویر سه بعدی و تکنیکهای یادگیری ماشین بستگی دارد که میتواند به ژنراتورها کمک کند تا درک واقعیتری از دنیای اطراف خود داشته باشند.
مولدهای تصویر هوش مصنوعی برای همیشه مبارزه نخواهند کرد
دستها یک مفهوم پیچیده برای هوش مصنوعی است که میتواند سر دودویی خود را به اطراف بپیچد، اما راهحلهایی برای این مشکل در حال حاضر کار میکنند. Midjourney، DALL-E 2 و دیگر پلتفرمها در نهایت میتوانند انگشتهای عجیب و غریب را به حداقل برسانند، اگر آنها را کاملاً از بین نبرند.
پیشرفت در سایر زمینههای هوش مصنوعی تضمین میکند که این فناوری دائماً در حال تکامل است و توسعهدهندگان آن همیشه راههای جدیدی برای اعمال و بهبود آن میآموزند.