المنصات التعريفية المتورطة في دعوى قضائية بشأن حقوق الطبع والنشر بشأن ممارسات التدريب على الذكاء الاصطناعي



تواجه Meta Platforms، الشركة الأم لفيسبوك وإنستغرام، حاليًا معركة قانونية كبيرة. قام بعض المؤلفين، بما في ذلك الممثلة الكوميدية سارة سيلفرمان والفائز بجائزة بوليتزر مايكل شابون، بتوحيد دعاواهم القضائية ضد ميتا، بدعوى الاستخدام غير المصرح به لأعمالهم المحمية بحقوق الطبع والنشر. يدعي هؤلاء المؤلفون أن شركة Meta استخدمت كتبهم دون إذن لتدريب نموذج لغة الذكاء الاصطناعي الخاص بها، اللاما.

تفاصيل القضية

وتزيد الدعوى القضائية، المرفوعة في 11 ديسمبر/كانون الأول، من التدقيق في ممارسات ميتا في تطوير تقنيات الذكاء الاصطناعي. أحد العناصر الرئيسية للدعوى هو تضمين سجلات الدردشة من باحث تابع لشركة Meta. تشير هذه السجلات، التي تمت مناقشتها في خادم Discord، إلى أن ميتا كان على علم بأن استخدامه للكتب يمكن أن ينتهك قانون حقوق النشر الأمريكي. نُقل عن الباحث تيم ديتميرز، مرشح الدكتوراه في جامعة واشنطن، في هذه السجلات مناقشة الآثار القانونية المترتبة على استخدام المواد المحمية بحقوق الطبع والنشر كبيانات تدريبية لنماذج الذكاء الاصطناعي.

في عام 2021، ذكر ديتميرز مناقشات مع القسم القانوني في ميتا فيما يتعلق بشرعية استخدام ملفات الكتب للتدريب. وتكشف السجلات أن محامي ميتا أعربوا عن مخاوفهم بشأن استخدام مثل هذه البيانات، مما يشير إلى وعي محتمل بالمخاطر القانونية التي تنطوي عليها.

التأثير على قطاع الذكاء الاصطناعي

تأتي هذه الدعوى وسط عدد متزايد من التحديات القانونية التي تواجهها شركات التكنولوجيا بشأن استخدام المحتوى المحمي بحقوق الطبع والنشر لتدريب نماذج الذكاء الاصطناعي التوليدية. وتخضع هذه النماذج، التي جذبت اهتمامًا عالميًا وحفزت استثمارات ضخمة، للتدقيق فيما يتعلق بممارساتها في الحصول على البيانات. يمكن أن تؤثر نتائج هذه الحالات بشكل كبير على مشهد الذكاء الاصطناعي التوليدي، مما قد يؤدي إلى زيادة تكاليف تطوير نماذج الذكاء الاصطناعي من خلال المطالبة بتعويض منشئي المحتوى.

بالإضافة إلى ذلك، قد تجبر لوائح الذكاء الاصطناعي الناشئة في أوروبا الشركات على الكشف عن بيانات التدريب الخاصة بها، مما يزيد من تعريضها للمخاطر القانونية. أصبحت هذه البيئة القانونية مصدر قلق متزايد لمطوري الذكاء الاصطناعي وصناعة التكنولوجيا.

نماذج Meta's Llama والكشف عن بيانات التدريب

أصدرت Meta الإصدار الأول من نموذج لغة اللاما الخاص بها في فبراير، مع تفاصيل مجموعات البيانات المستخدمة لتدريبها، والتي تضمنت "قسم Books3 في ThePile". يقال إن مجموعة البيانات هذه تحتوي على 196.640 كتابًا. ومع ذلك، بالنسبة لإصدارها الأخير، Llama 2، الذي تم إصداره للاستخدام التجاري في الصيف، لم تكشف Meta عن بيانات التدريب المستخدمة.

Llama 2، الذي تم تقديمه مجانًا للشركات التي لديها أقل من 700 مليون مستخدم نشط شهريًا، كان يُنظر إليه على أنه مصدر إزعاج محتمل في سوق برمجيات الذكاء الاصطناعي التوليدية. إنه يمثل تحديًا للاعبين الراسخين مثل OpenAI وGoogle، الذين يتقاضون رسومًا مقابل استخدام نماذجهم.

تسلط الدعوى المرفوعة ضد Meta Platforms الضوء على القضايا القانونية والأخلاقية المعقدة المحيطة بتطوير الذكاء الاصطناعي. مع ازدياد تقدم تقنيات الذكاء الاصطناعي وتكاملها في مختلف الصناعات، أصبحت أهمية تحديد مصادر بيانات التدريب بشكل مسؤول أكثر وضوحًا. يمكن أن تشكل نتيجة هذه الدعوى القضائية سابقة مهمة لكيفية تدريب نماذج الذكاء الاصطناعي والتوازن بين الابتكار وحماية حقوق الطبع والنشر.

ستتم مراقبة رد Meta على هذه الادعاءات والقرارات القانونية التي تتبعها عن كثب من قبل كل من مجتمع التكنولوجيا ومنشئي المحتوى. تسلط هذه القضية الضوء على الحاجة إلى أطر قانونية واضحة ومبادئ توجيهية أخلاقية في مجال الذكاء الاصطناعي سريع التطور.