صحة و جمال

تطور الإنسان “مجهر الذكاء الاصطناعي” للكشف عن مدى تفكير نماذج اللغة | أخبار التكنولوجيا


في ما قد يكون بمثابة اختراق مهم من الذكاء الاصطناعي ، قال الباحثون الأنثروبريون إنهم طوروا أداة جديدة للمساعدة في فهم كيفية عمل نماذج اللغة الكبيرة (LLMS) بالفعل.

قال بدء التشغيل AI وراء كلود إن الأداة الجديدة قادرة على فك تشفير كيفية تفكير LLMS. استلهمت الأنثروبور ، التي استلهمت من مجال علم الأعصاب ، إنها قادرة على بناء نوع من مجهر الذكاء الاصطناعى “دعونا نحدد أنماط النشاط وتدفقات المعلومات”.

وقالت الشركة في مدونة نشرت يوم الخميس 27 مارس: “إن معرفة كيف أن نماذج مثل كلود تعتقد أنها ستتيح لنا فهم أفضل لقدراتهم ، وكذلك مساعدتنا في ضمان قيامهم بما نعتزم به”.

تستمر القصة أسفل هذا الإعلان

إلى جانب قدراتها ، غالبًا ما يتم وصف LLMs اليوم على أنها صناديق سوداء لأن باحثو الذكاء الاصطناعى لم يكتشفوا بعد كيف وصلت نماذج الذكاء الاصطناعى إلى استجابة معينة دون الحاجة إلى أي برمجة. تتعلق مجالات الفهم الرمادية الأخرى بالهلوسة من الذكاء الاصطناعي ، والضبط ، والكسر.

ومع ذلك ، فإن الاختراق المحتمل يمكن أن يجعل الأعمال الداخلية لـ LLMs أكثر شفافية ومفهومة. هذا يمكن أن يزيد من إبلاغ تطوير نماذج AI أكثر أمانًا وآمنة وموثوقة. يمكن أن تؤدي معالجة مخاطر الذكاء الاصطناعي مثل الهلوسة أيضًا إلى زيادة اعتمادها بين الشركات.

ماذا فعل الأنثروبري

وقالت شركة ناشئة المدعومة من Amazon إنها أصدرت ورقتين علميتين جديدتين حول بناء مجهر “لبيولوجيا الذكاء الاصطناعى”.

بينما تركز الورقة الأولى على “أجزاء من المسار” التي تحول مدخلات المستخدم إلى مخرجات تم إنشاؤها بواسطة AI بواسطة Claude ، يلقي التقرير الثاني الضوء على ما يحدث بالضبط داخل Claude 3.5 Haiku عندما يستجيب LLM لمطالبة المستخدم.

تستمر القصة أسفل هذا الإعلان

https://www.youtube.com/watch؟v=BJ9BD2D3DZA

كجزء من تجاربها ، قامت الأنثروبور بتدريب نموذج مختلف تمامًا يسمى ترميز الطبقة عبر الطبقة (CLT). ولكن بدلاً من استخدام الأوزان ، قامت الشركة بتدريب النموذج باستخدام مجموعات من الميزات القابلة للتفسير مثل الاقتران لفعل معين أو أو أي مصطلح يقترح “أكثر من” ، وفقًا لتقرير قدمه حظ.

“إن طريقتنا تحلل النموذج ، لذلك نحصل على قطع جديدة ، ليست مثل الخلايا العصبية الأصلية ، ولكن هناك قطع ، مما يعني أننا يمكن أن نرى في الواقع كيف تلعب الأجزاء المختلفة أدوارًا مختلفة” ، ونقلت الباحث البشري جوش باتسون قوله.

وقال “إنه يتمتع أيضًا بميزة السماح للباحثين بتتبع عملية التفكير بأكملها من خلال طبقات الشبكة”.

نتائج الباحثين البشريين

بعد فحص نموذج كلود 3.5 هايكو باستخدام “مجهر الذكاء الاصطناعى” ، وجد الأنثروبور أن LLM تخطط قبل أن تقول ما ستقول. على سبيل المثال ، عندما يُطلب منهم كتابة قصيدة ، يحدد كلود كلمات قافية تتعلق بموضوع القصيدة أو موضوعها وتعمل للخلف لإنشاءها في جمل تنتهي بهذه الكلمات القافية.

تستمر القصة أسفل هذا الإعلان

الأهم من ذلك ، قال الإنسان إنه اكتشف ذلك كلود قادر على تكوين عملية تفكير وهمية. هذا يعني أن نموذج التفكير قد يبدو أنه “يفكر” في مشكلة في الرياضيات الصعبة بدلاً من تمثيل الخطوات التي تتخذها بدقة.

يبدو أن هذا الاكتشاف يتناقض مع شركات التكنولوجيا مثل Openai تقوله عن Meanuated Models و “سلسلة الفكر”. وقال باتسون: “على الرغم من أنها تدعي أنها تدير حسابًا ، إلا أن تقنيات قابلية التفسير لدينا لا تكشف عن أي دليل في كل هذا بعد أن حدث”.

في حالة وجود الهلوسة ، قال الأنثروبور إن “سلوك كلود الافتراضي هو رفض التكهن عند طرح سؤال ، ويجيب فقط على الأسئلة عندما يمنع شيء ما هذا التردد الافتراضي”.

في رد على مثال على جيلبريك ، وجد الأنثروبريك أن “النموذج الذي أدرك أنه قد تم طلب معلومات خطيرة قبل أن تتمكن من إعادة المحادثة بأمان.”

تستمر القصة أسفل هذا الإعلان

فجوات البحث في الدراسة

أقر الأنثروبري بأن طريقته لفتح صندوق الذكاء الاصطناعي الأسود كان لديه بعض العيوب. أوضحت الشركة: “إنه مجرد تقريب لما يحدث بالفعل داخل نموذج معقد مثل كلود”.

وأشار أيضًا إلى أنه قد تكون هناك خلايا عصبية موجودة خارج الدوائر المحددة من خلال طريقة CLT ، على الرغم من أنها قد تلعب دورًا في تحديد مخرجات النموذج.

“حتى في مطالبات قصيرة ، فإن طريقتنا لا تلتقط سوى جزء صغير من إجمالي الحساب الذي يؤديه كلود ، والآليات التي نراها قد تحتوي على بعض القطع الأثرية بناءً على أدوينا التي لا تعكس ما يجري في النموذج الأساسي” ، قال الأنثروبور.




اكتشاف المزيد من موقع تجاربنا

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع تجاربنا

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading