الرئيسية » أخبار التكنولوجيا
الذكاء الاصطناعي

واشنطن ـ المغرب اليوم

أعطت نتائج دراسة جديدة مصداقية للادعاءات بأن شركة الذكاء الاصطناعي "OpenAI" دربت على الأقل بعض نماذج الذكاء الاصطناعي التي طورتها على محتوى محمي بحقوق الطبع والنشر.

وتواجه الشركة بالفعل دعاوى قضائية رفعها مؤلفون ومبرمجون وأصحاب حقوق آخرون، متهمين "OpenAI" باستخدام أعمالهم -كتبهم وقواعد بياناتهم البرمجية وما إلى ذلك- لتطوير نماذجها دون إذن.

ولطالما تحججت "OpenAI" بدفاع الاستخدام العادل، لكن المدعين في هذه القضايا يجادلون بأنه لا يوجد استثناء في قانون حقوق الطبع والنشر الأميركي لبيانات التدريب.

وتقترح دراسة، شارك فيها باحثون من جامعة واشنطن وجامعة كوبنهاغن وجامعة ستانفورد، طريقة جديدة لتحديد بيانات التدريب التي "تتذكرها" نماذج تعتمد على واجهة برمجة تطبيقات، مثل نماذج "OpenAI"، بحسب تقرير لموقع "TechCrunch" المتخصص في أخبار التكنولوجيا، اطلعت عليه "العربية Business".

وتتعلم نماذج الذكاء الاصطناعي، بتدريبها على كميات كبيرة من البيانات، الأنماط، وهكذا تتمكن من إنشاء المقالات والصور وغيرها.

ومعظم النتائج التي تعطيها النماذج ليست نسخًا حرفية لبيانات التدريب، ولكن نظرًا لطريقة "تعلم" النماذج، فإن بعضها يكون كذلك حتمًا.

ووُجِد أن نماذج الصور تكرر لقطات شاشة من أفلام تدربت عليها، بينما لُوحظ أن نماذج اللغة تنتحل محتوى مقالات إخبارية بفعالية.

تعتمد منهجية الدراسة على كلمات يُطلق عليها المؤلفون المشاركون "high-surprisal" أي "ذات مفاجأة عالية"، وهي الكلمات التي تبرز على أنها غير شائعة في سياق أكبر.

على سبيل المثال، تُعتبر كلمة "رادار" في جملة "جلستُ أنا وجاك ساكنين تمامًا مع صوت أزيز الرادار" ذات مستوى مفاجأة عالية لأنها أقل احتمالًا إحصائيًا من كلمات مثل "محرك" أو "راديو" أن تظهر قبل كلمة "أزيز".

وفحص المشاركون في الدراسة العديد من نماذج شركة "OpenAI"، بما في ذلك "GPT-4" و"GPT-3.5"، بحثًا عن علامات الحفظ من خلال إزالة الكلمات ذات المفاجأة العالية من مقتطفات من كتب الخيال ومقالات صحيفة نيويورك تايمز، ودفع النماذج إلى محاولة "تخمين" الكلمات التي تم حجبها.

وخلص الباحثون إلى أنه إذا نجحت النماذج في التخمين بشكل صحيح، فمن المرجح أنها حفظت المقتطف أثناء عملية التدريب.

ووفقًا لنتائج الاختبارات، أظهر نموذج "GPT-4" علامات على حفظ أجزاء من كتب الخيال الشهيرة، بما في ذلك كتب في مجموعة بيانات تحتوي على عينات من كتب إلكترونية محمية بحقوق الطبع والنشر.

وأظهرت النتائج أيضًا أن النموذج حفظ أجزاء من مقالات صحيفة نيويورك تايمز، وإن كان بمعدل أقل نسبيًا.

قالت أبيلاشا رافيشاندر، طالبة الدكتوراه في جامعة واشنطن والمؤلفة المشاركة في الدراسة، لموقع "TechCrunch"، إن النتائج تُلقي الضوء على "البيانات المثيرة للجدل" التي ربما تم تدريب النماذج عليها.

وأضافت: "عملنا يهدف إلى توفير أداة لفحص النماذج اللغوية الكبيرة، ولكن هناك حاجة حقيقية إلى مزيد من شفافية البيانات في النظام البيئي بأكمله".

ولطالما دعت "OpenAI" إلى تخفيف القيود على تطوير النماذج باستخدام بيانات محمية بحقوق الطبع والنشر.

قد يهمك أيضـــــا

غرسة دماغية تترجم الأفكار إلى كلام مسموع بشكل فوري

 

الذكاء الاصطناعي يساعد في التغذية الوريدية للأطفال الخدّج

View on Almaghribtoday.net

أخبار ذات صلة

الاتحاد الأوروبي يمنح "غوغل" مهلة إضافية لرفع الحواجز التقنية…
ميتا تستعين بـ"مورجان ستانلي" و"جيه بي مورجان" لتمويل مركز…
مايكروسوفت تتجاوز التوقعات بنمو الحوسبة والذكاء الاصطناعي
مايكروسوفت تطلق وضع Xbox على أجهزة ويندوز 11 فى…
أمازون تعمل استعادة عمليات الحوسبة السحابية بالشرق الأوسط سيحتاج…

اخر الاخبار

بريطانيا تطالب "حزب الله" بإنهاء الهجمات على إسرائيل ونزع…
فرنسا تطلب اجتماعا طارئا لمجلس الأمن الدولي بشأن أحداث…
عراقجي يكشف آخر تطورات المفاوضات الأميركية الإيرانية
ترامب يتهم CNN بتشويه مضمون الاتفاق النووي الجاري التفاوض…

فن وموسيقى

فيفي عبده تكشف تفاصيل إصابتها بعد حادث منزلي مفاجئ
سعد لمجرد يخرج عن صمته عقب إدانته في فرنسا…
سعد لمجرد يُحكم عليه بالسجن 5 سنوات في فرنسا…
عمرو دياب يتصدر عربياً ويقتحم قائمة أقوى الفنانين رقمياً…

أخبار النجوم

إلغاء جميع حفلات محمد رمضان في الولايات المتحدة دون…
أحمد عز يوجّه رسالة للجمهور السعودي بعد عرض 7…
سلمى أبو ضيف تتألق في الدراما والسينما خلال 2026
نبيلة عبيد تكشف سبب تضحيتها بالأمومة وفشل زواجها الأول

رياضة

حكيمي أول لاعب عربي يعتلي عرش دوري أبطال أوروبا…
أشرف حكيمي يؤكد جاهزية منتخب المغرب لصناعة التاريخ في…
فيفا يتعهد بمساعدة المنتخب الإيراني للحصول على تأشيرات دخول…
ليونيل ميسي يثير القلق بعد إصابة عضلية قبل أسابيع…

صحة وتغذية

الصحة العالمية تؤكد ارتفاع حالات ”هانتا” لـ 13 إصابة…
توسيع نطاق فحوصات فيروس إيبولا في الكونغو الديمقراطية
"الصحة العالمية" تحذر من انهيار القطاع الصحي في لبنان…
فيروس إيبولا يخرج عن السيطرة في جمهورية الكونغو الديمقراطية

الأخبار الأكثر قراءة

مركبة ناسا المتنقلة تكتشف مزيدا من لبنات الحياة على…
5 أسباب تدفعك لعدم شراء هاتف سامسونغ
غوغل تعمل على تصميم نظارات ذكية مدعومة بالذكاء الاصطناعى
إطلاق صاروخ "سويوز-2.1ب" الفضائي حاملا مركبات فضائية لوزارة الدفاع…
غوغل تتصدر مستقبل الذكاء الاصطناعي