المأزق الحقيقي للذكاء الاصطناعي ليس ما يعتقده الناس
افتح ملخص المحرر مجانًا
رولا خلف، محررة الفايننشال تايمز، تختار قصصها المفضلة في هذه النشرة الأسبوعية.
هل تعتقد أن نموذج اللغة الكبيرة الرائد، GPT-4، يمكنه اقتراح حل لـ Wordle بعد أن تم وصف أربعة تخمينات سابقة له؟ هل يمكن أن يؤلف سيرة ذاتية لآلان تورينج، مع استبدال كلمة “تورينج” بكلمة “الكنيسة”؟ (كان مشرف رسالة الدكتوراه في تورينج هو ألونزو تشيرش، وأطروحة تشيرش-تورينج معروفة جيدًا. قد يربك ذلك الكمبيوتر، أليس كذلك؟) بعد عرض لعبة تيك تاك تو كاملة جزئيًا، هل يستطيع GPT-4 العثور على أفضل حركة واضحة؟
كل هذه الأسئلة، وأكثر، مقدمة كاختبار إدماني على موقع نيكولاس كارليني، الباحث في Google Deepmind. إنه يستحق بضع دقائق من وقتك كمثال توضيحي للقدرات المذهلة والقدرات المذهلة بنفس القدر لـ GPT-4. على سبيل المثال، على الرغم من حقيقة أن GPT-4 لا يمكنه العد وغالبًا ما يتعثر في الرياضيات الأساسية، إلا أنه يمكنه دمج الدالة x sin(x) – وهو شيء نسيت كيفية القيام به منذ فترة طويلة. من المعروف أنه ذكي في التلاعب بالألفاظ ولكنه يفشل في تحدي Wordle.
الأمر الأكثر إثارة للدهشة هو أنه على الرغم من أن GPT-4 لا يمكنه العثور على الحركة الفائزة في لعبة tic-tac-toe، إلا أنه يمكنه “كتابة صفحة ويب جافا سكريبت كاملة للعب tic-tac-toe ضد الكمبيوتر” حيث “يجب أن يلعب الكمبيوتر بشكل مثالي وهكذا”. لا تخسر أبدًا” في غضون ثوانٍ.
ويخرج المرء من اختبار كارليني بثلاث رؤى. أولاً، لا يستطيع GPT-4 حل العديد من المشكلات التي قد تستنزف خبرة بشرية فحسب، بل يمكنه القيام بذلك بسرعة أكبر بمائة مرة. ثانيًا، هناك العديد من المهام الأخرى التي يرتكب فيها GPT-4 أخطاء قد تحرج طفلًا في العاشرة من عمره. ثالثًا، من الصعب جدًا معرفة المهام التي تندرج ضمن أي فئة. مع الخبرة، يبدأ المرء في الشعور بنقاط الضعف والقوى العظمى الخفية لنموذج اللغة الكبير، ولكن حتى المستخدمين ذوي الخبرة سوف يفاجأون.
يوضح اختبار كارليني نقطة تم استكشافها في سياق أكثر واقعية من قبل فريق من الباحثين الذين يعملون مع مجموعة بوسطن الاستشارية (BCG). تركز دراستهم على سبب كون نقاط القوة والضعف في الذكاء الاصطناعي التوليدي غير متوقعة في كثير من الأحيان. ومن الملائم أن يحمل عنوان “الإبحار في الحدود التكنولوجية الخشنة”.
في شركة BCG، تفوق المستشارون المسلحون بـ GPT-4 بشكل كبير على أولئك الذين لا يملكون الأداة. وقد تم تكليفهم بمجموعة من المهام الواقعية مثل طرح أفكار المنتجات وإجراء تحليل تجزئة السوق وكتابة بيان صحفي. أما أولئك الذين لديهم GPT-4 فقد قاموا بمزيد من العمل وبسرعة أكبر وبجودة أعلى بكثير. يبدو أن GPT-4 هو مساعد رائع لأي مستشار إداري، خاصة أولئك الذين لديهم مهارة أو خبرة أقل.
قام الباحثون أيضًا بتضمين مهمة بدا أن الذكاء الاصطناعي يجدها سهلة، ولكن تم تصميمها بعناية لإرباكها. وكان الهدف من ذلك تقديم توصيات استراتيجية إلى العميل بناءً على البيانات المالية ونصوص المقابلات مع الموظفين. وكانت الحيلة هي أن البيانات المالية من المرجح أن تكون مضللة ما لم يتم النظر إليها في ضوء المقابلات.
لم تكن هذه المهمة خارج نطاق المستشار القادر، لكنها خدعت الذكاء الاصطناعي، الذي كان يميل إلى تقديم نصيحة استراتيجية سيئة للغاية. وبطبيعة الحال، كان للاستشاريين الحرية في تجاهل مخرجات الذكاء الاصطناعي، أو حتى استبعاد الذكاء الاصطناعي بالكامل، لكنهم نادرًا ما فعلوا ذلك. كانت هذه هي المهمة الوحيدة التي كان أداء الاستشاريين غير المساعدين فيها أفضل من أداء المستشارين المجهزين بجهاز GPT-4.
هذه هي “الحدود المتعرجة” لأداء الذكاء الاصطناعي التوليدي. أحيانًا يكون الذكاء الاصطناعي أفضل منك، وأحيانًا تكون أنت أفضل منه. حظا سعيدا في التخمين الذي هو.
هذا العمود هو الثالث في سلسلة حول الذكاء الاصطناعي التوليدي، حيث كنت أسعى جاهدة للعثور على سوابق تكنولوجية لما لم يسبق له مثيل. ومع ذلك، فحتى التشبيه غير الكامل يمكن أن يكون مفيدًا. إن النظر إلى أنظمة الطيران السلكي المساعدة ينبهنا إلى خطر الرضا عن النفس وفقدان المهارات؛ يوضح لنا الارتفاع المفاجئ لجداول البيانات الرقمية كيف يمكن للتكنولوجيا أن تدمر ما يبدو أنه أسس الصناعة، ومع ذلك تؤدي في النهاية إلى توسيع عدد ونطاق الوظائف الجديدة في تلك الصناعة.
أود هذا الأسبوع أن أقترح منتجًا أخيرًا: جهاز iPhone. عندما أطلق ستيف جوبز هاتف iPhone المميز في عام 2007، لم يتخيل سوى عدد قليل من الناس مدى انتشار الهواتف الذكية في كل مكان. في البداية لم تكن أكثر من مجرد لعبة باهظة الثمن. كان التطبيق القاتل هو القدرة على جعلها تفرقع وتطن مثل السيف الضوئي. ومع ذلك، سرعان ما أصبحنا نقضي وقتًا أطول مع هواتفنا الذكية مقارنة بأحبائنا، ونستخدمها لتحل محل التلفزيون والراديو والكاميرا والكمبيوتر المحمول ونظام الملاحة عبر الأقمار الصناعية وجهاز Walkman وبطاقة الائتمان – وقبل كل شيء، كمصدر لا نهاية له من الإلهاء.
لماذا تشير إلى أن iPhone قد يعلمنا شيئًا عن الذكاء الاصطناعي التوليدي؟ التقنيات مختلفة، صحيح. لكننا قد نرغب في التفكير في مدى السرعة التي أصبحنا نعتمد بها على الهواتف الذكية ومدى سرعة تحولنا إليها كعادة، وليس كخيار متعمد. نريد الصحبة، ولكن بدلاً من مقابلة صديق، نقوم بإطلاق تغريدة. نريد شيئًا لنقرأه، لكن بدلًا من التقاط كتاب، ننتهي. بدلاً من الفيلم الجيد، تيك توك. أصبح البريد الإلكتروني والواتساب بديلاً عن القيام بالعمل الحقيقي.
سيكون هناك وقت ومكان للذكاء الاصطناعي التوليدي، تمامًا كما يوجد وقت ومكان لاستشارة الكمبيوتر العملاق في جيبك. ولكن قد لا يكون من السهل معرفة متى سيساعدنا ومتى سيقف في طريقنا. على عكس الذكاء الاصطناعي التوليدي، يمكن لأي شخص لديه قلم وورقة وثلاث دقائق إضافية أن يكتب قائمة بما يفعله بشكل أفضل باستخدام هاتف ذكي في يده، وما يفعله بشكل أفضل عندما يكون الهاتف الذكي بعيدًا عن الأنظار. ويكمن التحدي في تذكر تلك القائمة والتصرف وفقًا لها.
يعد الهاتف الذكي أداة قوية يسيء معظمنا استخدامها عدة مرات في اليوم دون قصد، على الرغم من أنها أقل غموضًا بكثير من نموذج لغة كبير مثل GPT-4. هل سنتمكن حقًا من القيام بعمل أفضل باستخدام أدوات الذكاء الاصطناعي القادمة؟
كتاب تيم هارفورد الجديد للأطفال، “The Truth Detective” (Wren & Rook)، متوفر الآن
يتبع @FTMag للتعرف على أحدث قصصنا أولاً
اكتشاف المزيد من موقع تجاربنا
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.