در دنیای سریع هوش مصنوعی، ابزارهای گوناگونی پدید آمدهاند که هر کدام قابلیتهای فوقالعادهای دارند. یکی از این ابزارهای ویژه، هوش مصنوعی Dall-E است که از پیشروهای ساخت تصویر از روی متن به شمار میرود. Dall-E توسط شرکت OpenAI ساخته شده و با فهمیدن دستورات نوشتاری میتواند تصاویر هنری و طبیعی خلق کند. این فناوری، مرزهای هنر و تکنولوژی را از بین برده و به همه—از طراحان و هنرمندان تا افراد معمولی—اجازه میدهد تا ایدههای ذهنی خود را فقط با تایپ چند کلمه، به تصویر تبدیل کنند. از نقاشیهای تخیلی و رویایی گرفته تا عکسهای دقیق و واقعی، هوش مصنوعی Dall-E دری تازه به دنیای خلاقیت باز کرده است.
امروزه این ابزار، هم یک پدیده فناورانه است و هم وسیلهای قدرتمند برای خلق آثار هنری و تجاری. از کاربردهای آن میتوان به طراحی گرافیکی، ساختن محتوای تصویری برای شبکههای اجتماعی و حتی خلق ایدههای بصری برای فیلمها و بازیها اشاره کرد. قابلیت Dall-E در تبدیل ایدههای ذهنی به تصاویر واقعی در زمان کوتاه، باعث صرفهجویی در وقت و افزایش سرعت انجام کارها شده است.
آنچه در این مطلب خواهید آموخت نمایش سرفصل ها
Toggle
تاریخچه هوش مصنوعی Dall-Eچگونه از Dall-E استفاده کنیمنصب برنامه Dall-E 2تفاوت هوش مصنوعی Dall-E با Midjourney دانلود هوش مصنوعی Dall-E 3 و بررسی آن
تاریخچه هوش مصنوعی Dall-E
هوش مصنوعی DALL-E برای نخستین بار در ماه ژانویه سال ۲۰۲۱ توسط شرکت OpenAI به دنیا معرفی شد. اسم آن از ترکیب نام سالوادور دالی، نقاش مشهور، و شخصیت رباتی فیلم وال-ای ساخته شده است. این نام به خوبی نشاندهنده ماهیت این ابزار است: ترکیبی از هنر و خلاقیت با هوش ماشینی.
برای گسترش دانش خود، به مقاله 9 ربات هوش مصنوعی انسان نما (ایرانی و خارجی) سر بزنید.
**DALL-E 1:**
این مدل اولین نسخه بود و با وجود محدودیتهایش، توانست تصاویر قابل توجهی از روی متن تولید کند. میتوانست مفاهیم به ظاهر نامربوط را با هم ترکیب کند، تصاویر را از زوایای مختلف نشان دهد و حتی ویژگیهای یک تصویر را تغییر دهد. اگرچه دسترسی عمومی به DALL-E 1 محدود بود، اما توانست محققان و هنرمندان را شگفتزده کند و ثابت کرد که مدلهای زبانی میتوانند ورای متن عمل کنند و وارد دنیای بصری شوند. این نسخه گام مهمی برای شروع این مسیر بود.
**DALL-E 2:**
در آوریل ۲۰۲۲، شرکت OpenAI نسخه پیشرفتهتری به نام DALL-E 2 را ارائه کرد. این مدل با کیفیت بالاتر، وضوح بهتر و تصاویر واقعیتر، تحول بزرگی در هوش مصنوعی تولیدکننده تصویر ایجاد کرد. قابلیتهای جدیدی مانند «inpainting» (پر کردن قسمتهای خالی تصویر با محتوای مناسب) و «outpainting» (بزرگ کردن تصویر و ادامه دادن آن فراتر از حاشیه اصلی) نیز معرفی شد. DALL-E 2 به صورت عمومی منتشر شد و توجه هنرمندان و برنامهنویسان زیادی را جلب کرد. این مدل در تولید تصاویر با جزئیات دقیق و درک دستورات پیچیده عملکرد بسیار بهتری داشت و به ابزاری قدرتمند برای خلق آثار هنری تبدیل شد.
**DALL-E 3:**
جدیدترین و قویترین نسخه این فناوری، DALL-E 3 است که در سپتامبر ۲۰۲۳ رونمایی شد. این مدل میتواند دستورات متنی را با دقت و جزئیات بیشتری درک کند و تصاویری با کیفیت بسیار بالا تولید نماید. DALL-E 3 طوری طراحی شده که به خوبی با مدلهای زبانی مانند ChatGPT همکاری میکند و کاربران میتوانند از طریق گفتوگو، دستورات خود را برای تولید تصویر بهبود بخشند. این ویژگیها باعث شده که DALL-E 3 به یکی از برترین ابزارهای تولید تصویر تبدیل شود. همچنین این نسخه توانسته بسیاری از مشکلات نسخههای قبلی، مانند تولید متن خوانا در تصاویر و درک بهتر ارتباط بین اشیاء را برطرف کند.

چگونه از Dall-E استفاده کنیم
کار با هوش مصنوعی DALL-E بسیار آسان است، اما برای گرفتن بهترین نتیجه، باید یاد بگیرید که چطور دستورهای مناسب به آن بدهید.
**چطور به DALL-E دسترسی پیدا کنیم:**
در حال حاضر، شما میتوانید از DALL-E از طریق نسخه پولی ChatGPT (یعنی ChatGPT Plus) یا از طریق ابزارهای مایکروسافت مثل Bing Image Creator استفاده کنید. اگر میخواهید به صورت رایگان از DALL-E استفاده کنید، Bing Image Creator بهترین انتخاب است. این ابزار به شما این امکان را میدهد که هر روز تعداد محدودی عکس بدون پرداخت پول تولید کنید. این گزینه برای کسانی که میخواهند قابلیتهای DALL-E را آزمایش کنند، بسیار مناسب است. اما اگر به تمام ویژگیهای کامل DALL-E 2 و DALL-E 3 نیاز دارید، باید اشتراک ChatGPT Plus را بخرید. با این اشتراک، میتوانید به صورت نامحدود عکس تولید کنید و به امکانات پیشرفتهتر دسترسی داشته باشید.
**چطور یک دستور خوب بنویسیم:**
رمز موفقیت در کار با DALL-E، نوشتن دستورهای دقیق و پُرجزئیات است. به جای اینکه فقط بنویسید «یک گربه»، سعی کنید جزئیات بیشتری اضافه کنید. مثلاً بنویسید: «یک گربه نارنجی با کلاه فضانوردی که در حال نگاه کردن به کهکشان است، به سبک نقاشی آبرنگ و با نورپردازی زیبا». هرچه دستور شما دقیقتر و جزئیتر باشد، تصویر نهایی بیشتر شبیه چیزی میشود که در ذهن دارید. همچنین میتوانید از کلماتی مثل «عکس»، «طراحی»، «سهبعدی»، «واقعی» یا «فانتزی» برای مشخص کردن سبک تصویر استفاده کنید.
**تولید عکس:**
بعد از نوشتن دستور، DALL-E در عرض چند ثانیه چندین عکس بر اساس درخواست شما میسازد. معمولاً چهار تصویر به شما نشان داده میشود و شما میتوانید از بین آنها بهترین را انتخاب کنید.
**ویرایش و بهبود نتایج:**
اگر از عکسهایی که ساخته شده راضی نیستید، میتوانید دستور خود را تغییر دهید و دوباره امتحان کنید. این فرآیند آزمایش و خطا به شما کمک میکند تا در نهایت به نتیجه دلخواه برسید. میتوانید با اضافه یا کم کردن کلمات، یا با تغییر سبک و جزئیات، نتایج کاملاً جدیدی بگیرید.
**در مورد دانلود DALL-E:**
باید بدانید که DALL-E یک برنامه قابل دانلود نیست. DALL-E 2 و DALL-E 3 به صورت آنلاین و بر روی فضای ابری کار میکنند و شما فقط از طریق مرورگر وب میتوانید به آنها دسترسی داشته باشید. این روش، استفاده از این ابزار را روی هر دستگاهی (مثل موبایل یا کامپیوتر) بسیار آسان کرده و دیگر لازم نیست نگران دانلود کردن آن باشید.
نصب برنامه Dall-E 2
همانطور که گفته شد، برنامههایی مثل DALL-E 2 و نسخههای جدیدتر آن به شکل نرمافزار قابل نصب ارائه نمیشوند. برای استفاده از این سرویس، باید از طریق وبسایت DALL-E 2 که درون پلتفرمهای دیگر قرار دارد، اقدام کنید.
**دسترسی از طریق OpenAI:**
میتوانید به وبسایت رسمی OpenAI بروید و پس از ساختن حساب کاربری، وارد محیط DALL-E 2 شوید. این روش، مستقیمترین راه برای استفاده از این ابزار است. البته برای تولید تصویر معمولاً باید اعتبار پولی تهیه کنید یا اشتراک داشته باشید.
در صورت علاقهمندی، مطلب معرفی بهترین توکن هوش مصنوعی [7 توکن برتر] را از دست ندهید.
**استفاده از Bing Image Creator:**
اگر میخواهید از DALL-E 2 به زبان فارسی استفاده کنید، Bing Image Creator در مرورگر Microsoft Edge یا سایت Bing گزینه خوبی است. این ابزار هم از مدل DALL-E استفاده میکند و دستورات فارسی را هم میفهمد. Bing Image Creator انتخاب مناسبی برای کسانی است که به دنبال یک ابزار قوی و رایگان برای ساخت تصاویر هستند.
DALL-E 2 فارسی این امکان را به کاربران ایرانی میدهد که با زبان خودشان دستور بدهند و تصویر مورد نظرشان را ایجاد کنند. این ویژگی، کار با ابزار را برای فارسیزبانان بسیار راحت کرده و به آنها اجازه میدهد بدون نگرانی از مشکل زبان، ایدههای خود را به تصویر بکشند.

تفاوت هوش مصنوعی Dall-E با Midjourney
در دنیای تولید عکس با هوش مصنوعی، میدجرنی یکی از اصلیترین رقبای دال-ئی محسوب میشود. هر دوی این ابزارها قابلیتهای خارقالعادهای دارند، اما ویژگیهای مهمی آنها را از هم جدا میکند. دال-ئی که محصول شرکت اوپنایآی است، بیشتر به دنبال ساختن تصاویر واقعی و دقیق از دستورات شماست. در مقابل، میدجرنی روی خلق تصاویر هنری، تخیلی و چشمنواز تمرکز دارد.
به طور کلی، دال-ئی دستورات پیچیده را بهتر درک میکند، اما میدجرنی عکسهایی با جلوهی بصری حیرتانگیزتری خلق مینماید.
این تمایزها باعث میشود کاربران بسته به هدفی که دارند، یکی از این دو را برگزینند. اگر میخواهید تصویری دقیق و نزدیک به واقعیت از یک شیء یا صحنه بسازید، دال-ئی انتخاب مناسبتری است. اما اگر به دنبال خلق تصاویر هنری، رویایی و تخیلی با حالوهوای خاص هستید، میدجرنی احتمالاً نتیجهی بهتری به شما خواهد داد. هر دو این ابزارها پیوسته در حال بهتر شدن هستند و قابلیتهای تازهای به آنها اضافه میشود.
| ویژگی | هوش مصنوعی Dall-E | Midjourney |
| توسعهدهنده | OpenAI | Midjourney Research Lab |
| دسترسی | از طریق ChatGPT Plus و Bing Image Creator | از طریق دیسکورد (Discord) |
| سبک تصاویر | واقعگرا و دقیق | هنری، فانتزی و با جزئیات بالا |
| درک متن | درک بهتر دستورات پیچیده و چندوجهی | درک خوب دستورات، اما تمرکز بر سبک هنری |
| رابط کاربری | وبسایت و ادغام در چت جی پی تی | محیط مبتنی بر چت در دیسکورد |
Export to Sheets
دانلود هوش مصنوعی Dall-E 3 و بررسی آن
همانطور که قبلاً گفتیم، امکان دانلود هوش مصنوعی DALL-E 3 به شکل یک نرمافزار مستقل وجود ندارد. در حال حاضر، این فناوری فقط از طریق پلتفرم ChatGPT Plus و Microsoft Bing Copilot قابل دسترسی است. این مدل جدید، با پیشرفتهای قابل توجهی که در سرعت، دقت و توانایی درک زبان داشته، کیفیت کار کاربران را به شکل محسوسی ارتقا داده است.
هوش مصنوعی DALL-E 3 میتواند تصاویری با جزئیات بسیار بالا و شگفتانگیز تولید کند. به عنوان نمونه، اگر یک درخواست پیچیده شامل چندین بخش مختلف به آن بدهید، این هوش مصنوعی قادر است تمام آن بخشها را به طور هماهنگ و منسجم در تصویر نهایی نمایش دهد. این ویژگی، DALL-E 3 را به ابزاری بسیار کاربردی برای طراحان، نقاشان و همه کسانی که میخواهند تصاویر دقیق و هنرمندانه خلق کنند، تبدیل کرده است.
یک قابلیت مهم دیگر، قرارگیری این فناوری در محیط ChatGPT است که به شما امکان میدهد به شکل گفتگومحور و پرسش و پاسخ با آن کار کنید. شما میتوانید درخواست خود را مرحله به مرحله اصلاح کنید تا در نهایت به نتیجه ایدهآل خود برسید. این روش، فرآیند تولید تصویر را به یک تجربه پویا و لذتبخش تبدیل میکند. همچنین این نسخه جدید، مشکل نوشتن متنهای خوانا روی تصاویر را که در نسخههای قدیمیتر وجود داشت، به میزان زیادی برطرف کرده است.

ابزارهای هوش مصنوعی مانند DALL-E و نسلهای بعدی آن مثل DALL-E 2 و DALL-E 3، مسیر آینده هنر و طراحی را نشان میدهند. این سامانهها میتوانند از روی توضیحات متنی، تصویر بسازند و به این ترتیب به هنرمندان و حتی افراد عادی کمک میکنند تا ایدههای ذهنی خود را به سادگی به تصویر بکشند. اگرچه معمولاً لازم نیست این فناوری را مستقیماً روی رایانه نصب کنید و بیشتر از طریق فضای ابری قابل دسترسی است، اما این موضوع از اهمیت و کاربرد گسترده آن کم نمیکند. چه از نسخه رایگان DALL-E استفاده کنید و چه به انواع پیشرفتهتر آن دسترسی داشته باشید، این فناوری مرزهای خلاقیت را جابهجا کرده و فرصتهای تازهای در اختیار انسان قرار داده است.
اگر به این موضوع علاقه دارید، حتماً بهترین کلاس و ابزارهای هوش مصنوعی برای کودکان را بخوانید.
