يمكن للذكاء الاصطناعي للذكاء الاصطناعي المفتوح إنشاء صور من عبارات مثل “كرسي على شكل أفوكادو”

يمكن للذكاء الاصطناعي للذكاء الاصطناعي المفتوح إنشاء صور من عبارات مثل "كرسي على شكل أفوكادو"

رسم توضيحي لمقال بعنوان

صورة: افتح AI

أنشأ Open AI ذكاءً اصطناعيًا يحول الجمل إلى صور. يطلق عليه DALL · E (تلاعب بالكلمات بين WALL · E و Dalí) وهو نسخة مصغرة من مولد نص GPT-3 القوي.

تم تدريب DALL · E ، وهو إصدار 12 مليار معامل من GPT-3 ، باستخدام نموذج ثانٍ يسمى CLIP الذي تعلم التعرف على الصور من أوصافها النصية ؛ ليس من تسميات مثل “قطة” أو “موزة” ، وهي الطريقة التي يتم بها تدريب معظم نماذج التعرف على الصور ، ولكن من الأوصاف الكاملة المأخوذة من الإنترنت.

تبعا افتح AI، يمكن لـ CLIP التعرف على كائنات خارج مجموعة البيانات التي تم التدريب عليها ، بينما DALLE قادرة على رسم أشياء مثل:

ساعة خماسية خضراء

غير معرف

صورة: افتح AI

صورة طعام صيني

غير معرف

صورة: افتح AI

منظر مقطعي للجوز

غير معرف

صورة: افتح AI

حلزون مصنوع من القيثارة

غير معرف

صورة: افتح AI

صورة توضيحية لطفل رضيع يرتدي توتو يمشي مع كلب

غير معرف

صورة: افتح AI

كابيبارا يجلس في حقل بأساليب فنية مختلفة

غير معرف

صورة: افتح AI

تم إنشاء كل هذه المجموعات المكونة من 30 صورة تلقائيًا بواسطة DALL · E من الأوصاف المكتوبة للباحثين وتم اختيارها بواسطة CLIP ، والتي قررت أي منها يناسبهم بشكل أفضل.

إذا كان إصدار منشئ النص من GPT-3 يقلد ملف بشكل دقيق الكتابة البشرية ، DALL · E قادرة على التنبؤ بالرؤية البشرية بطرق أكثر إبداعًا من البشر أنفسهم.

لا يطيع الذكاء الاصطناعي فقط دلالات الأوصاف ، ولكنه قادر على إنشاء نسخ مجسمة من الحيوانات والأشياء ، الجمع بين المفاهيم التي لا يمكن ربطها بشكل معقول.

مع 175 مليار معلمة ، تعد GPT-3 أكبر شبكة عصبية في العالم. أنشأها Open AI ، وهي شركة غير ربحية أسسها مستثمرون مثل سام التمان وإيلون ماسك الذي نأى بنفسه عن المشروع. استثمرت Microsoft مليار دولار في عام 2019 ، أي بعد أربع سنوات تقريبًا من تأسيسها. يتوفر GPT-3 API كإصدار تجريبي خاص.

READ  لماذا لا يجب أن تأكل ناجتس الدجاج ، ولماذا لا تثق بالبيانات الضخمة

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir