نبرد بین تصویر سازهای هوش مصنوعی روز به روز داغ تر می شود! چندی پیش شرکت Adobe از نسخۀ تجاری Firefly رونمایی و این هوش مصنوعی مولد را به فوتوشاپ، ایلاستریتور و اکسپرس اضافه کرد. حتی اخیراً شرکت مایکروسافت اعلام کرده که ممکن است به نرم افزار قدیمی و نوستالژیک Paint یک موتور قدرت گرفته از هوش مصنوعی را اضافه نماید! در این میان، OpenAI که می توان آن را آغازگر این عصر نوین دانست، از نسل سوم تصویر ساز هوش مصنوعی محبوب خود، DALL-E، رونمایی کرده است. این نسخۀ جدید که با نام DALL-E 3 معرفی شده به روز رسانی های چشمگیری را دریافت کرده و به ابزاری ایمن تر و کاربردی تر تبدیل شده است.
نکتۀ کلیدی این است که تصویرساز دال ای قرار است با سرویس متن محور ChatGPT ادغام شود! بر اساس اعلام اوپن ای آی، کاربران به زودی قادر خواهند بود تا از چت جی پی تی برای تولید درخواست هایی که به دال ای می دهند، کمک بگیرند. به عبارت دیگر، به جای آنکه خودتان جملۀ درخواست به DALL-E را بنویسید و زمان زیادی برای توصیف جزئیاتی که می خواهید در عکس باشد صرف کنید، می توانید از ChatGPT برای این کار کمک بگیرید!
در اثبات مفید بودن این قابلیت، محققان OpenAI طی یک مثال تصویری نشان داده اند که چگونه چت جی پی تی یک پاراگراف طولانی را برای وصف لوگوی یک رستوران ژاپنی تولید کرده و سپس دال ای از این پاراگراف برای طراحی چند کانسپت مختلف بهره برده است.
این شرکت معتقد است که ادغام DALL-E 3 با ChatGPT به افراد بیشتری اجازه می دهد تا از مزایای تصویرسازی هنری هوش مصنوعی بهره مند شوند. به خصوص کسانی که مهارت های نوشتاری پایینی دارند و نمی توانند آن چیزی را که در ذهنشان است در قالب متن ارائه دهند، می توانند از این ویژگی جدید استفاده کنند و با دال ای ارتباط برقرار نمایند.
علاوه بر این، OpenAI خاطر نشان کرده است که در توسعۀ DALL-E 3 بر روی ارتقای امنیت تمرکز ویژه ای داشته است. در همین راستا این شرکت از مکانیزم هایی مانند دسته بندی ورودی هایی که برای آموزش هوش مصنوعی مورد استفاده قرار می گیرند، استفاده کرده است تا از تولید محتوای ناخوشایند و خارج از عرف جلوگیری به عمل آورد. اوپن آی آی با چندین تیم خارج از شرکت خود برای ارزیابی و تست این سیستم همکاری داشته تا از عملکرد صحیح آن در این زمینه مطمئن شود. همچنین در گزارش ها آمده که دل ای 3 از لحاظ رعایت قواعد کپی رایتینگ ارتقا پیدا کرده و از عکس چهره های عمومی یا آثار هنری ثبت شده استفاده نمی کند.
بنابر اعلام OpenAI، هوش مصنوعی تصویر ساز دال ای 3 ظرفیت چند ماه آتی عرضه خواهد شد و در ابتدا برای کاربران ChatGPT Plus و ChatGPT Enterprise در دسترس قرار خواهد گرفت. این شرکت در مورد اینکه آیا این ابزار به صورت رایگان و عمومی هم قابل استفاده خواهد بود یا نه اطلاعاتی را منتشر نکرده است. بد نیست بدانید که مایکروسافت نیز چندی پیش ابزار تصویرساز Bing Image Creator را به مرورگر Edge اضافه کرده است. این ابزار بر اساس مدل DALL-E توسعه یافته است.
منبع: neowin