ما الذي يمكن أن يتعلمه الذكاء الاصطناعي التوليدي من المستنقع البدائي؟

ابق على اطلاع بالتحديثات المجانية

أولاً، نتعلم أن نماذج الذكاء الاصطناعي التوليدية يمكن أن “تهلوس”، وهي طريقة أنيقة للقول إن نماذج اللغة الكبيرة تختلق الأشياء. كما أخبرني ChatGPT نفسه (في هذه الحالة بشكل موثوق)، يمكن لـ LLM إنشاء أحداث تاريخية مزيفة وأشخاص غير موجودين ونظريات علمية كاذبة وكتب ومقالات خيالية. الآن، يخبرنا الباحثون أن بعض حاملي شهادات الماجستير في القانون قد ينهارون تحت وطأة عيوبهم. هل هذه حقا هي التكنولوجيا العجيبة في عصرنا والتي أنفقت عليها مئات المليارات من الدولارات؟

في بحث نُشر في مجلة Nature الأسبوع الماضي، استكشف فريق من الباحثين مخاطر “تلوث البيانات” في تدريب أنظمة الذكاء الاصطناعي ومخاطر انهيار النماذج. بعد أن استوعبت بالفعل معظم تريليونات الكلمات التي أنشأها الإنسان على الإنترنت، أصبحت أحدث نماذج الذكاء الاصطناعي التوليدي تعتمد الآن بشكل متزايد على البيانات الاصطناعية التي أنشأتها نماذج الذكاء الاصطناعي نفسها. ومع ذلك، يمكن لهذه البيانات التي ينشئها الروبوت أن تهدد سلامة مجموعات التدريب بسبب فقدان التباين وتكرار الأخطاء. وخلص المؤلفون إلى “لقد وجدنا أن الاستخدام العشوائي للمحتوى الناتج عن النموذج في التدريب يسبب عيوبًا لا رجعة فيها في النماذج الناتجة”.

يبدو أن هذه النماذج، مثل الثعبان الأسطوري القديم Ouroboros، تأكل ذيولها.

أخبرني إيليا شوميلوف، الذي كان المؤلف الرئيسي للدراسة عندما كان باحثًا في جامعة أكسفورد، أن النتيجة الرئيسية من البحث هي أن معدل التطور في الذكاء الاصطناعي التوليدي من المرجح أن يتباطأ مع ندرة البيانات عالية الجودة. ويقول: “الفرضية الأساسية للبحث هي أن الأنظمة التي نبنيها حاليًا سوف تتدهور”.

تقدر شركة الأبحاث Epoch AI أن هناك حاليًا 300 تريليون رمز (وحدات صغيرة من البيانات) من النصوص العامة التي أنشأها الإنسان جيدة بما يكفي لاستخدامها لأغراض التدريب. وفقا لتوقعاتها، قد يتم استنفاد هذا المخزون من البيانات بحلول عام 2028. وبعد ذلك، لن يكون هناك ما يكفي من البيانات الجديدة عالية الجودة التي أنشأها الإنسان لتغذية القادوس، وقد يصبح الاعتماد المفرط على البيانات الاصطناعية مشكلة، كما فعلت مجلة Nature. تقترح الورقة.

وهذا لا يعني أن النماذج الحالية التي يتم تدريبها في الأغلب على البيانات التي يولدها الإنسان سوف تصبح عديمة الفائدة. على الرغم من عاداتهم الهلوسة، لا يزال من الممكن تطبيقها على عدد لا يحصى من الاستخدامات. في الواقع، يقول الباحثون إنه قد تكون هناك ميزة الريادة لطلاب الماجستير في القانون الأوائل الذين تم تدريبهم على البيانات غير الملوثة التي لم تعد متاحة الآن لنماذج الجيل التالي. يشير المنطق إلى أن هذا سيؤدي أيضًا إلى زيادة قيمة البيانات الجديدة والخاصة التي أنشأها الإنسان، وينبغي للناشرين أن ينتبهوا لذلك.

لقد تمت مناقشة المخاطر النظرية لانهيار النموذج لسنوات، وما زال الباحثون يجادلون بأن الاستخدام التمييزي للبيانات الاصطناعية يمكن أن يكون ذا قيمة لا تقدر بثمن. ومع ذلك، فمن الواضح أنه سيتعين على باحثي الذكاء الاصطناعي إنفاق المزيد من الوقت والمال على تنقية بياناتهم. إحدى الشركات التي تستكشف أفضل الطرق للقيام بذلك هي Hugging Face، وهي منصة التعلم الآلي التعاونية التي يستخدمها مجتمع البحث.

قامت شركة Hugging Face بإنشاء مجموعات تدريب عالية التنسيق تتضمن بيانات تركيبية. كما أنها تركز أيضًا على نماذج اللغة الصغيرة في مجالات محددة، مثل الطب والعلوم، التي يسهل التحكم فيها. “معظم الباحثين يحتقرون تنظيف البيانات. ولكن عليك أن تأكل الخضروات الخاصة بك. يقول أنطون لوزكوف، مهندس التعلم الآلي في شركة Hugging Face: “في مرحلة ما، يتعين على الجميع تكريس وقتهم لذلك”.

على الرغم من أن القيود المفروضة على نماذج الذكاء الاصطناعي التوليدي أصبحت أكثر وضوحا، فمن غير المرجح أن تعرقل ثورة الذكاء الاصطناعي عن مسارها. في الواقع، ربما يكون هناك الآن تركيز متجدد على مجالات أبحاث الذكاء الاصطناعي المجاورة، والتي تم إهمالها نسبيًا في الآونة الأخيرة ولكنها قد تؤدي إلى تقدمات جديدة. يهتم بعض الباحثين في مجال الذكاء الاصطناعي بشكل خاص بالتقدم المحرز في الذكاء الاصطناعي المتجسد، كما هو الحال في الروبوتات والمركبات ذاتية القيادة.

عندما أجريت مقابلة مع العالمة المعرفية أليسون جوبنيك في وقت سابق من هذا العام، أشارت إلى أن علماء الروبوتات هم الذين كانوا يبنون الذكاء الاصطناعي التأسيسي: لم تكن أنظمتهم أسيرة على الإنترنت ولكنها كانت تغامر بالدخول إلى العالم الحقيقي، وتستخرج المعلومات من تفاعلاتهم وتكيف قدراتهم. الردود نتيجة لذلك.

واقترحت قائلة: “هذا هو الطريق الذي يتعين عليك اتباعه إذا كنت تحاول حقًا تصميم شيء ذكي حقًا”.

ففي النهاية، كما أشار جوبنيك، كانت هذه بالضبط هي الطريقة التي ظهر بها الذكاء البيولوجي في الأصل من المستنقع البدائي. أحدث نماذجنا للذكاء الاصطناعي قد تأسرنا بقدراتها. لكن لا يزال أمامهم الكثير ليتعلموه من تطور أكثر الديدان والإسفنجيات بدائية منذ أكثر من نصف مليار سنة.

john.thornhill@ft.com

مرتبط

الوسوم

ما الذي يمكن أن يتعلمه الذكاء الاصطناعي التوليدي من المستنقع البدائي؟

مرتبط

tjarbna

اترك تعليقاً إلغاء الرد

هل أثار باول للتو موجة من السيولة؟

بولندا تعتقل منتقدًا للكرملين متهمًا بتوجيه الهجوم على مساعد أليكسي نافالني

عرض مردوخ لـ REA لشراء Rightmove إلى ما يقرب من 5.9 مليار جنيه إسترليني

يواجه “حراس بوابة” الأدوية الأمريكية دعوى قضائية ضد الاحتكار من لجنة التجارة الفيدرالية (FTC) بشأن أسعار الأنسولين

فيضانات النيجر تؤخر العام الدراسي الجديد لمدة شهر تقريبًا

هل أثار باول للتو موجة من السيولة؟

بولندا تعتقل منتقدًا للكرملين متهمًا بتوجيه الهجوم على مساعد أليكسي نافالني

أغسطس 2024
س	د	ن	ث	أرب	خ	ج
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

مرتبط

العثور على المال لأوكرانيا "تحدي" - واشنطن - RT World News

يواجه رئيس WaPo تحقيقًا بشأن اختراق الهاتف – رئيس وزراء المملكة المتحدة السابق – RT World News

مقالات ذات صلة

اترك تعليقاً إلغاء الرد