تم بناء ازدهار صناعة الذكاء الاصطناعي على البيانات ، وتأتي هذه البيانات من الإنترنت ، والتي جاءت في النهاية منا نحن المستخدمين. من المدونات الشخصية إلى صفحات الويب وخيوط Reddit ، ساهمت كل كلمة نشاركها في تعليم روبوتات الدردشة AI في جميع أنحاء العالم. يُظهر تحليل واشنطن بوست لمجموعة البيانات العامة المستخدمة على نطاق واسع لتدريب أنظمة الذكاء الاصطناعي مدى اتساع المجال لأخذ عينات من خزينة النشر على الإنترنت لمدة 30 عامًا لتعليم شبكاتها العصبية.
في حين أن هذا التغيير اللفظي الهائل يؤدي إلى نزاع قانوني مهم حول ما إذا كان ينبغي التعامل معه على أنه استخدام عادل أو سرقة ، فإنه يلهم أيضًا حسابًا شخصيًا للملايين الذين ساهموا في بناء عالم الإنترنت الذي نعرفه اليوم. كنا نظن أننا نشارك قلوبنا وعقولنا ، وبالطبع كنا كذلك. ولكن دون أن ندرك ذلك ، كنا ننشئ أيضًا قاعدة بيانات ، غير مكتملة ولكنها غنية ، للتعبير البشري الذي يجعل من الممكن بشكل خارق للبراعة في إكمال الجمل من ChatGPT ومنافسيها.
ومع ذلك ، فقد أثر هذا الإدراك بالفعل على المبدعين المرئيين ، مثل المصورين والرسامين ، الذين يتصارعون مع استخدام أعمالهم في المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي. يواجه الموسيقيون نفس النوع من عيد الغطاس ، حيث أصبحت نسخ طبق الأصل من أعمالهم أكثر شيوعًا. لكن عددًا أكبر بكثير منا كتب على الإنترنت أكثر من سجل الأغاني أو ابتكر الفن المرئي.
يسمح بحث الواشنطن بوست للمستخدمين بإدخال أي اسم مجال على الإنترنت لمعرفة مدى إسهامه في قاعدة بيانات تدريب على الذكاء الاصطناعي. تضمنت مجموعة البيانات التي تم تحليلها أكثر من نصف مليون مدونة شخصية ، تمثل 3.8٪ من إجمالي أجزاء اللغة. في حين أن قواعد بيانات التدريب هائلة ، إلا أنها بالكاد تمثيلية ، مع وجود بعض الثقافات ، والمجموعات ، والموضوعات مفرطة في أخذ عيناتها ، والبعض الآخر مهمل بشكل غير عادل. علاوة على ذلك ، تظهر جميع التحيزات والقيود والجوانب السامة لثقافة الإنترنت في بيانات التدريب على الذكاء الاصطناعي.
مع استمرار تعطش الذكاء الاصطناعي لبيانات التدريب ، أصبحت النتيجة غير المقصودة لتاريخ الإنترنت الممتد على مدى 30 عامًا كقاعدة بيانات للتعبير البشري في دائرة الضوء الآن. أصبحت المخزونات الرقمية ومدافن المعلومات والأفكار والمشاعر التي أنشأناها لبعضنا البعض وقودًا لاختراقات الذكاء الاصطناعي. ومع ذلك ، فإن هذا يثير تساؤلات حول التأثير المستقبلي للذكاء الاصطناعي على إنتاج العمل الأصلي وخطر أن تكون نماذج الذكاء الاصطناعي المستقبلية عالقة بمعلومات قديمة.
إذا أطلقنا العنان لفيضان من المحاكاة على شبكاتنا العامة ، فإننا نجازف بإحباط الناس من الاستمرار في مشاركة أو حتى صنع عملهم الأصلي. قد يترك ذلك نماذج الذكاء الاصطناعي المستقبلية عالقة إلى الأبد مع الناتج المجمد للبشرية حوالي 2000-2020 ، مع عدم وجود شيء جديد يمكن التعلم منه. بينما نواصل تشكيل الذكاء الاصطناعي ، فإنه بدوره سيشكل مستقبلنا بطرق لا يمكننا توقعها. هذا تذكير مهم بأن كل ما نقوم به مع الذكاء الاصطناعي سيكون له عواقب ستتردد صداها بعيدًا في المستقبل.