أعلنت شركة OpenAI تحديثًا جديدًا لروبوت الذكاء الاصطناعي ChatGPT يتيح للمستخدمين إنشاء صور بناءً على تعليمات مفصلة ومعقدة وغير تقليدية، في خطوة تشكّل تطورًا بارزًا في أهم منتج للشركة.
ويعتمد الإصدار الجديد من ChatGPT على نموذج GPT-4o، الذي يتيح للروبوت تحليل النصوص والصور معًا ضمن نظام واحد متكامل، مما يمنحه قدرة غير مسبوقة على توليد صور أكثر تعقيدًا ودقة.
ووفقًا للشركة، فقد أصبح بإمكان المستخدمين – على سبيل المثال – وصف صورة كرتونية مكوّنة من أربع لوحات، مع تحديد الشخصيات التي تظهر في كل لوحة وما تقوله، لينشئ ChatGPT فورًا رسمًا كرتونيًا متكاملًا بناءً على هذه التفاصيل.

ومع أن الإصدارات السابقة من ChatGPT كانت قادرة على إنشاء الصور، فإنها لم تكن تتمتع بالقدرة على إدماج مفاهيم متعددة ومتنوعة في صورة واحدة بدقة وموثوقية، كما لم تكن قادرة على التعامل مع النصوص داخل الصور بنحو دقيق كما هو الحال مع التحديث الجديد.
وعانت النماذج السابقة للذكاء الاصطناعي مشكلات في إدراج النصوص داخل الصور، إذ كانت النتائج غالبًا غير واضحة أو غير مفهومة، لكن GPT-4o يتفوق في هذا المجال، إذ يمكنه إنشاء لافتات تحتوي على نصوص مقروءة بوضوح، وهو تحسن كبير مقارنة بالإصدارات السابقة.
وعادةً، تبدأ عملية إنشاء الصور بإدخال وصف نصي، ثم يعدله المستخدم تدريجيًا للحصول على النتيجة المرجوة. لكن GPT-4o يتيح تجربة تفاعلية أكثر، إذ يمكن للمستخدم طلب صورة، ثم تقديم تعليمات متتالية لتعديلها، مثل تغيير الألوان أو إضافة تفاصيل جديدة، دون الحاجة إلى إعادة كتابة الوصف بالكامل.
ويتيح نموذج GPT-4o تجربة تفاعلية أكثر في تعديل الصور، إذ يمكن للمستخدم طلب إنشاء صورة أو رفعها، ثم تقديم تعليمات متتالية لتعديلها، مثل تغيير الألوان أو إضافة تفاصيل جديدة، دون الحاجة إلى إعادة كتابة الوصف بالكامل.
وأوضح غابرييل غو، الباحث في OpenAI، أن هذه التقنية تشكّل “نوعًا جديدًا تمامًا من الذكاء الاصطناعي”، مضيفًا أن نماذج الشركة “لم تعد تفصل بين توليد النصوص وإنشاء الصور، بل تدمج العمليتين معًا للحصول على نتائج أكثر سلاسة ودقة”.
وأشار غو إلى أن نماذج توليد الصور التقليدية واجهت دومًا صعوبة في إنشاء صور لمفاهيم غير مألوفة، مثل دراجة بعجلات مثلثة، لكن الإصدار الجديد من ChatGPT أصبح قادرًا على التعامل مع هذه الطلبات المعقدة بسهولة.
وأعلنت OpenAI أن التحديث الجديد لروبوت ChatGPT سيكون متاحًا لكافة المستخدمين، سواء عبر النسخة المجانية أو من خلال الاشتراكات المأجورة. يُذكر أن خاصية إنشاء الصور متاحة لأصحاب الحسابات المجانية، لكن بنحو محدود، وسوف يتأخر إطلاق التحديث الأخير لهم، وفقًا لما أعلنته الشركة.
ونشرت OpenAI عدة توضح إمكانيات GPT-4o في إنشاء الصور، إذ يمكن للمستخدمين مشاهدة كيفية تعديل الصور خطوة بخطوة والتفاعل مع ChatGPT لتحسين النتائج.
وأُطلق ChatGPT أول مرة في نهاية عام 2022، وقد كان يعتمد على تحليل كميات كبيرة من النصوص عبر الإنترنت، مما مكّنه من الإجابة عن الأسئلة، وكتابة القصائد، وحتى برمجة الأكواد، لكنه لم يكن قادرًا على إنشاء الصور آنذاك.
وبعد نحو عام، أطلقت OpenAI نموذج DALL-E لتوليد الصور، لكنه كان منفصلًا عن ChatGPT. أما الآن، فقد أدمجت الشركة النظامين في منصة واحدة تجمع بين قدرات النصوص والصور، مما يعزز إمكانيات الذكاء الاصطناعي التوليدي في ChatGPT بنحو غير مسبوق.
نسخ الرابط تم نسخ الرابط
0 تعليق