“يجب محاذاة منظمة العفو الدولية مع القيم الصحيحة من البداية”: CTGT’s Cyril Gorlla | أخبار التكنولوجيا

وقال سيريل غورلا البالغ من العمر 23 عامًا ، المؤسس المشارك والرئيس التنفيذي لشركة CTGT ، وهي شركة ناشئة تمكن المؤسسات التي تتكيف مع احتياجاتهم في الوقت الحقيقي: “ستدمج الذكاء الاصطناعى بعمق في الحوكمة والمجتمع والأعمال التجارية ، ويجب أن ندمج القيم الصحيحة منذ البداية”. في شرح أكبر المفاهيم الخاطئة حول إزالة التحيز والرقابة من نماذج الذكاء الاصطناعى ، طلب غورلا تخيل سيناريو يكون فيه صانع السياسة أو هيئة حكومية يتخذ قرارات بناءً على مخرجات منظمة العفو الدولية المتحيزة. وأكد أن الناس في كثير من الأحيان يقللون من التأثير طويل الأجل للتحيز في نماذج الذكاء الاصطناعي.
“إن الآثار المتصلة ، بعد سنوات ، يمكن أن تضر بالمجتمعات بشكل غير متناسب. ما زلنا في الأيام الأولى ، مثل الإنترنت في التسعينيات. منظمة العفو الدولية ستدمج بعمق في الحوكمة والمجتمع والأعمال ، ويجب علينا تضمين القيم الصحيحة منذ البداية”. Indianexpress.com.
جمعت CTGT مؤخرًا 7.2 مليون دولار في جولة بذرة مفرطة. قاد هذا التمويل ، صندوق AI في المرحلة المبكرة من Google ، بدعم من General Catalyst و Y Combinator و Siquid 2 و Deepwater وغيرهم من المستثمرين من الملاك المعروفين. شارك Gorlla في تأسيس CTGT مع Trevor Tuttle الذي يعمل أيضًا كـ CTO للشركة.
في وقت سابق من هذا العام ، ابتكرت شركة Deepseek من AI الصينية تموجات حول العالم بعد أن قدمت نموذج AI الرائد Deepseek-R1 الذي قيل إنه تم صنعه في جزء صغير من التكلفة المستثمرة في نماذج الذكاء الاصطناعى الأعلى من قبل أمثال Openai و Microsoft و Google ، إلخ. طورت CTGT ، بقيادة Gorlla ، طريقة رياضية لإزالة الرقابة والتحيز على مستوى النموذج.
CTGT عزل وتعديل ميزات النموذج الداخلي المسؤولة عن تصفية التحيز. ادعت الشركة أن هذا النهج يلغي الحاجة إلى backpropagation ويسمح بتدريب النماذج وتخصيصها وتطويرها أسرع 500 مرة. مع هذه الطريقة ، تمكنت الشركة على الفور من تحديد ميزات النموذج التي تسبب التحيز والرقابة وعزلها ثم تعديلها. أثناء الاختبار ، تمكنت CTGT من تخفيف التحيز والرقابة في Deepseek R1 100 في المائة من الوقت. وفقًا للشركة ، يمكن تطبيق هذه الطريقة على أي نموذج مفتوح الوزن لإزالة التحيز.
إزالة التحيز والرقابة
عندما سئل عن كيفية تمكنهم من تجريد الرقابة والتحيز من نموذج Deepseek ، قال: “عندما أطلقت Deepseek ، أثارت مخاوف الأمن القومي بسبب تحيزها. قررنا أن نظهر علنًا ما يمكن أن يفعله منصتنا بالفعل. لقد قمنا بتحليل أي تأثير على هذه الخلايا العصبية التي أطلقت عليها أية الخلايا العصبية. إعادة التدريب. “
منذ أن حصلت الشركة على نجاح بنسبة 100 في المائة في إزالة التحيز والرقابة ، سألنا كيف تمكنوا من اختبار والتحقق من ذلك. ورد Gorlla بالقول إنه في CTGT ، استخدموا مجموعة بيانات ملكية من المطالبات التي عادة ما تخضع للرقابة من قبل Deepseek. “في الأصل ، أجاب Deepseek فقط حوالي 32 ٪ من هذه المطالبات. بعد تدخلنا ، أجاب جميعها تقريبًا. تراوحت الاستعلامات من المواضيع الحساسة سياسيًا إلى المخرجات المتحيزة العامة. لقد تحققنا من التحسن من خلال مقارنة معدلات إعادة الرفض واكتمال الإجابة قبل التدخل وبعدها.”
تستمر القصة أسفل هذا الإعلان
في حديثه عن استجابة مجتمع الذكاء الاصطناعى والمستثمرين لمنهجيتهم ، قال غورلا إن ورقتهم ، تغرد ، وتحدثه في واشنطن اكتسب أكثر من مليون مشاهدة. “أعتقد أنه صدى لأنه أظهر مسارًا جديدًا ، وفهم نماذج من المبادئ الأولى ، وليس فقط التحجيم. عملنا يمكّن الذكاء الاصطناعي الذكي والشخصي دون ضبطه باهظ الثمن ، مما يجعله أكثر سهولة وتوافق مع القيم الديمقراطية.”
الهلوسة والمخاوف بشأن الذكاء الاصطناعي
عندما يتعلق الأمر بنماذج الذكاء الاصطناعي ، تكون الهلوسة عندما ينتج النموذج مخرجات غير صحيحة أو مضللة في بعض الأحيان أو في بعض الأحيان غير منطقية. ومن المثير للاهتمام ، أن هذه المخرجات قد تظهر في البداية مقنعة. عندما سئلوا عن كيفية معالجة طريقتهم مسألة الهلوسة ، قال غورلا إن معظم تدابير الوقاية من الهلوسة اليوم تنطوي على الهندسة الفورية ، مما يقلل من الأداء النموذجية. “يحدد نهجنا ميزات محددة مسؤولة عن الهلوسة ، كما هو الحال في نموذج Google الشهير الذي يقول لاستخدام الغراء على البيتزا. نحن نحدد رياضيًا وتقلل من تأثير الميزات غير الصحيحة دون تحلل الأداء العام” ، أوضح غورلا.
على الظل المماثل ، تحدث غورلا أيضًا عن المخاوف المتعلقة بـ AI في مجالات المخاطر العالية مثل الرعاية الصحية والتمويل. وفقًا لخريج HDSI UC San Diego ، فإن منصة GTCT تضع نماذجها في مصادر موثوقة ، مما يتيح التحكم الدقيق. “على سبيل المثال ، يتغذى عميل الأمن السيبراني في المستندات الداخلية ، ونحن نعزل الميزات ذات الصلة. في الرعاية الصحية ، نساعد على تحسين طريقة السرير والاستجابات الواقعية. هذه ليست معايير الرياضيات ، إنها تفاعلات بشرية دقيقة ، ونحن نسمح للعملاء بتضمين قيمهم مباشرة.”
هل منظمة العفو الدولية تهديد خطير أم سوء فهم واضح؟
خلال المحادثة ، شارك Gorlla أيضًا وجهات نظره حول الوتيرة السريعة لتطورات الذكاء الاصطناعي ومخاوفه وآماله. حول انفجار مولد الصور المتقدم في Openai وحالة الفن الذي تم إنشاؤه من الذكاء الاصطناعى ، قال Gorlla إنه نظر إليه على أنه إضفاء الطابع الديمقراطي على الإبداع. “فكر في أن السيارة تحل محل عربات تجرها الخيول ، كان الأمر مثيرًا للجدل أيضًا. تتيح الذكاء الاصطناعى للأشخاص التعبير عن أفكارهم الذين لم يكونوا قد اختاروا قلم رصاص. إن القيد الآن ليس مهارة تقنية ولكن الإبداع والتفكير. هذا تحول قوي”.
تستمر القصة أسفل هذا الإعلان
عند سؤالهم عما إذا كان الذكاء الاصطناعى يمثل تهديدًا خطيرًا للوظائف أو ما إذا كان قد أسيء فهمه ، قال غورلا: “إنه أمر دقيق”. ووفقا له ، حتى لو تفوقت الذكاء الاصطناعي على البشر ، فإن الناس يقاومون استبدالهم. وهو يعتقد اعتقادا راسخا أنه في مجالات متخصصة مثل القانون والرعاية الصحية ، سيبقى البشر أطول. ومع ذلك ، في الأدوار القابلة للاستبدال مثل كتابة النصوص أو التسويق ، ستعطل الذكاء الاصطناعي. “لا يتعلق الأمر بالاستبدال ، ولكن التضخيم. يمكن لأولئك الذين يستخدمون الذكاء الاصطناعي 10x أو 100x ناتجهم. أولئك الذين لا يتركون وراءهم.”
عندما سئل عن المستقبل الذي تصوره مع الذكاء الاصطناعى وما يقلقه أكثر ، قال غورلا إن اهتمامه الأكبر كان الدفعة العمياء للمقياس ، الذي وصفه بأنه “مجرد صنع صناديق سوداء أكبر”. دعا غورلا إلى الأساليب “المبدئية والمنطقية” حيث تكون النماذج مفهومة ومحاذاة للقيم وتخصيصها. “هذا هو المستقبل الذي نبنيه: الذكاء الاصطناعي الآمن والجدير بالثقة الذي يعكس الفرد ، وليس الشركة أو الدولة.”
في سباق التسلح الذكري المستمر بين الصين والولايات المتحدة ، في أعقاب الدافع العميق ، أكد غوريلا أن الولايات المتحدة لا تحتاج إلى الفوز بالمقياس بل بالقيم. يشعر رجل الأعمال والمبتكر الشاب أن الولايات المتحدة يجب أن تميل نحو الانفتاح وتنوع الفكر والنشر الآمن. “هذا ما أخبرته بالبيت الأبيض والكونغرس: النصر يكمن في منظمة العفو الدولية المبدئية والجديرة بالثقة التي تضع السيطرة في أيدي المستخدم.”
اكتشاف المزيد من موقع تجاربنا
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.



