يمكن للذكاء الاصطناعي للذكاء الاصطناعي المفتوح إنشاء صور من عبارات مثل "كرسي على شكل أفوكادو"

أنشأ Open AI ذكاءً اصطناعيًا يحول الجمل إلى صور. يطلق عليه DALL · E (تلاعب بالكلمات بين WALL · E و Dalí) وهو نسخة مصغرة من مولد نص GPT-3 القوي.

تم تدريب DALL · E ، وهو إصدار 12 مليار معامل من GPT-3 ، باستخدام نموذج ثانٍ يسمى CLIP الذي تعلم التعرف على الصور من أوصافها النصية ؛ ليس من تسميات مثل “قطة” أو “موزة” ، وهي الطريقة التي يتم بها تدريب معظم نماذج التعرف على الصور ، ولكن من الأوصاف الكاملة المأخوذة من الإنترنت.

تبعا افتح AI، يمكن لـ CLIP التعرف على كائنات خارج مجموعة البيانات التي تم التدريب عليها ، بينما DALLE قادرة على رسم أشياء مثل:

ساعة خماسية خضراء

صورة طعام صيني

منظر مقطعي للجوز

حلزون مصنوع من القيثارة

صورة توضيحية لطفل رضيع يرتدي توتو يمشي مع كلب

كابيبارا يجلس في حقل بأساليب فنية مختلفة

تم إنشاء كل هذه المجموعات المكونة من 30 صورة تلقائيًا بواسطة DALL · E من الأوصاف المكتوبة للباحثين وتم اختيارها بواسطة CLIP ، والتي قررت أي منها يناسبهم بشكل أفضل.

إذا كان إصدار منشئ النص من GPT-3 يقلد ملف بشكل دقيق الكتابة البشرية ، DALL · E قادرة على التنبؤ بالرؤية البشرية بطرق أكثر إبداعًا من البشر أنفسهم.

لا يطيع الذكاء الاصطناعي فقط دلالات الأوصاف ، ولكنه قادر على إنشاء نسخ مجسمة من الحيوانات والأشياء ، الجمع بين المفاهيم التي لا يمكن ربطها بشكل معقول.

مع 175 مليار معلمة ، تعد GPT-3 أكبر شبكة عصبية في العالم. أنشأها Open AI ، وهي شركة غير ربحية أسسها مستثمرون مثل سام التمان وإيلون ماسك الذي نأى بنفسه عن المشروع. استثمرت Microsoft مليار دولار في عام 2019 ، أي بعد أربع سنوات تقريبًا من تأسيسها. يتوفر GPT-3 API كإصدار تجريبي خاص.

Nurten Sadak

“Web hayranı. Tipik düşünür. İçine kapanık. Amatör iletişimci. Pop kültürü meraklısı.”

READ İstanbul Menkul Kıymetler Borsası'na yakın Türkiye dairesi