اكتشاف جديد صادم حول نماذج الذكاء الاصطناعي من “OpenAI”

جمال علم الدين أبريل 5, 2025

0 806 2 دقائق

اكتشاف جديد صادم حول نماذج الذكاء الاصطناعي من "OpenAI"

أعطت نتائج دراسة جديدة مصداقية للادعاءات بأن شركة الذكاء الاصطناعي “OpenAI” دربت على الأقل بعض نماذج الذكاء الاصطناعي التي طورتها على محتوى محمي بحقوق الطبع والنشر.

وتواجه الشركة بالفعل دعاوى قضائية رفعها مؤلفون ومبرمجون وأصحاب حقوق آخرون، متهمين “OpenAI” باستخدام أعمالهم -كتبهم وقواعد بياناتهم البرمجية وما إلى ذلك- لتطوير نماذجها دون إذن.

ولطالما تحججت “OpenAI” بدفاع الاستخدام العادل، لكن المدعين في هذه القضايا يجادلون بأنه لا يوجد استثناء في قانون حقوق الطبع والنشر الأميركي لبيانات التدريب.

وتقترح دراسة، شارك فيها باحثون من جامعة واشنطن وجامعة كوبنهاغن وجامعة ستانفورد، طريقة جديدة لتحديد بيانات التدريب التي “تتذكرها” نماذج تعتمد على واجهة برمجة تطبيقات، مثل نماذج “OpenAI”، بحسب تقرير لموقع “TechCrunch” المتخصص في أخبار التكنولوجيا، اطلعت عليه “العربية Business”.

وتتعلم نماذج الذكاء الاصطناعي، بتدريبها على كميات كبيرة من البيانات، الأنماط، وهكذا تتمكن من إنشاء المقالات والصور وغيرها.

ومعظم النتائج التي تعطيها النماذج ليست نسخًا حرفية لبيانات التدريب، ولكن نظرًا لطريقة “تعلم” النماذج، فإن بعضها يكون كذلك حتمًا.

ووُجِد أن نماذج الصور تكرر لقطات شاشة من أفلام تدربت عليها، بينما لُوحظ أن نماذج اللغة تنتحل محتوى مقالات إخبارية بفعالية.

تعتمد منهجية الدراسة على كلمات يُطلق عليها المؤلفون المشاركون “high-surprisal” أي “ذات مفاجأة عالية”، وهي الكلمات التي تبرز على أنها غير شائعة في سياق أكبر.

على سبيل المثال، تُعتبر كلمة “رادار” في جملة “جلستُ أنا وجاك ساكنين تمامًا مع صوت أزيز الرادار” ذات مستوى مفاجأة عالية لأنها أقل احتمالًا إحصائيًا من كلمات مثل “محرك” أو “راديو” أن تظهر قبل كلمة “أزيز”.

وفحص المشاركون في الدراسة العديد من نماذج شركة “OpenAI“، بما في ذلك “GPT-4” و”GPT-3.5″، بحثًا عن علامات الحفظ من خلال إزالة الكلمات ذات المفاجأة العالية من مقتطفات من كتب الخيال ومقالات صحيفة نيويورك تايمز، ودفع النماذج إلى محاولة “تخمين” الكلمات التي تم حجبها.

وخلص الباحثون إلى أنه إذا نجحت النماذج في التخمين بشكل صحيح، فمن المرجح أنها حفظت المقتطف أثناء عملية التدريب.

ووفقًا لنتائج الاختبارات، أظهر نموذج “GPT-4” علامات على حفظ أجزاء من كتب الخيال الشهيرة، بما في ذلك كتب في مجموعة بيانات تحتوي على عينات من كتب إلكترونية محمية بحقوق الطبع والنشر.

وأظهرت النتائج أيضًا أن النموذج حفظ أجزاء من مقالات صحيفة نيويورك تايمز، وإن كان بمعدل أقل نسبيًا.

قالت أبيلاشا رافيشاندر، طالبة الدكتوراه في جامعة واشنطن والمؤلفة المشاركة في الدراسة، لموقع “TechCrunch”، إن النتائج تُلقي الضوء على “البيانات المثيرة للجدل” التي ربما تم تدريب النماذج عليها.

وأضافت: “عملنا يهدف إلى توفير أداة لفحص النماذج اللغوية الكبيرة، ولكن هناك حاجة حقيقية إلى مزيد من شفافية البيانات في النظام البيئي بأكمله”.

ولطالما دعت “OpenAI” إلى تخفيف القيود على تطوير النماذج باستخدام بيانات محمية بحقوق الطبع والنشر.

الوسوم

جمال علم الدين أبريل 5, 2025

0 806 2 دقائق

اكتشاف جديد صادم حول نماذج الذكاء الاصطناعي من “OpenAI”

جمال علم الدين

اترك تعليقاً إلغاء الرد

بدجت السعودية وتمارا.. شراكة استراتيجية تعيد تعريف تجربة تأجير السيارات

Dragon Ball Super: Super Hero Hits Cinemas Across the Region August 18th

زد توقع شراكة استراتيجية مع سناب شات لدعم أكثر من 13 ألف تاجر في المملكة العربية السعودية

دور صندوق الاستثمارات العامة في تحقيق ريادة السعودية في قطاع الهيدروجين

عجمان تطلق “مركز عجمان للمشاريع الجديدة – منطقة حرة” حل مبتكر وسَلِس لتأسيس الأعمال في الإمارات

دراسة جديدة.. د. رشيد عمّور يُحقق كتاب “التسديد في شرح التمهيد”

فيس بوك ماسنجر يتوقف لدى ملايين المستخدمين خلال أيام.. هل تتأثر رسائلك؟

الشرق يلعب على ملعبه لأول مرة منذ تأسيسه

Bybit تعتمد خطة أمنية شاملة لحماية مصالح متداولي العملات الرقمية بعد اختراق تاريخي بمليار دولار

جمال علم الدين

Subscribe to our mailing list to get the new updates!

السعودية تستضيف "معرض التحول الصناعي 2025" في ديسمبر المقبل

القبض على 6 مروّجين في جدة.. إحباط تهريب نصف طن "قات" في قطاع الربوعة

مقالات ذات صلة

الصحة وعلوم الحياة في عام 2026: البيانات تكتسب خبرة متقدمة، والذكاء الاصطناعي يحدد مستقبل الرعاية الصحية

شركة CNTXT AI تطلق “منصّت” Munsit، أدق منصة ذكاء اصطناعي صوتي باللغة العربية في العالم، مع تسارع الطلب على خدمات الذكاء الاصطناعي في دولة الإمارات

توسيع شراكة Rakuten Mobile مع Netcracker في مجال نظم دعم الأعمال (BSS) الرقمي المُمكّن بالذكاء الاصطناعي لدعم شبكة الهاتف المحمول الخاصة بها في اليابان

استطلاع تابي: حوالي نصف المتسوّقين في الشرق الأوسط يستخدمون الذكاء الاصطناعي لاتخاذ قرارات الشراء، فيما لا تزال الثقة به محدودة.