صحة و جمال

هل يمكن أن يساعدنا نموذج الذكاء الاصطناعي في التحدث إلى الدلافين؟ يمكن أن يكون Dolphingemma من Google هو المفتاح | أخبار التكنولوجيا


ماذا تقول الدلافين لبعضها البعض؟ ماذا يحاولون إخبارنا؟ يمكن أن تقربنا التطورات الحديثة في التعلم الآلي ونماذج اللغة الكبيرة (LLMS) من تحقيق الهدف الطويل المنحوت المتمثل في التواصل بين الأنواع.

أعلنت Google يوم الاثنين ، 14 أبريل ، أن نموذج الذكاء الاصطناعى التأسيسي الذي يسمى Dolphingemma سيكون متاحًا للباحثين الآخرين في هذا المجال هذا الصيف. ادعى عملاق التكنولوجيا أن نموذج الذكاء الاصطناعى المفتوح هذا قد تم تدريبه على توليد “تسلسلات صوتية تشبه الدلفين الجديدة” وسيسهل يومًا ما التواصل التفاعلي بين البشر والدلافين.

وقال جوجل في منشور مدونة: “من خلال تحديد أنماط الصوت المتكررة والمجموعات والتسلسلات الموثوقة ، يمكن أن يساعد النموذج الباحثين في الكشف عن الهياكل المخفية والمعاني المحتملة داخل التواصل الطبيعي للدلافين – وهي مهمة تتطلب سابقًا جهدًا بشريًا هائلاً”.

تستمر القصة أسفل هذا الإعلان

وأضاف “في النهاية ، قد تنشئ هذه الأنماط ، المعززة بالأصوات الاصطناعية التي أنشأها الباحثون للإشارة إلى الأشياء التي تحبها الدلافين للعب بها ، بمفردات مشتركة مع الدلافين للاتصال التفاعلي”.

تم تطوير نموذج الذكاء الاصطناعى من قبل Google بالتعاون مع باحثو الذكاء الاصطناعي في Georgia Tech. تم تدريبه على مجموعات البيانات التي تم جمعها من الباحثين الميدانيين الذين يعملون مع Wild Dolphin Project (WDP) ، وهي منظمة بحثية غير ربحية.

ما هو Dolphingemma؟

Dolphingemma هو نموذج لغة صغير خفيف الوزن مع عدد معلمات يبلغ 400 مليون مما يجعل من الأمثل تشغيل هواتف البكسل لاستخدامها من قبل باحثين في WDP تحت الماء ، حسبما زعمت Google.

تشتمل تقنيةها الأساسية على رمز صوتي من Google المستخدم لتحويل أصوات الدلفين إلى سلسلة من الوحدات المنفصلة التي يمكن التحكم فيها تسمى الرموز. تقترض الهندسة المعمارية النموذجية من سلسلة gemma من Google من نماذج الذكاء الاصطناعي المفتوحة.

تستمر القصة أسفل هذا الإعلان

Dolphingemma هو نموذج صوتي وصوت ، مما يعني أنه يعالج الصوت بدلاً من النص ، ومن المحتمل ألا يستجيب للمطالبات المكتوبة.

على غرار كيف تتنبأ LLMs بالكلمة التالية أو الرمز المميز في جملة في اللغة البشرية ، يحلل Dolphingemma “تسلسل أصوات الدلفين الطبيعية لتحديد الأنماط والهيكل والتنبؤ في النهاية بالأصوات اللاحقة المحتملة في تسلسل”.

كشفت الشركة أنها تخطط لإصدار Dolphingemma كنموذج مفتوح حتى يتمكن باحثون آخرون من ضبط النموذج بناءً على أصوات أنواع السيتاسان المختلفة مثل الدلافين الزجرية ودلافين الدوار.

ما هي البيانات المستخدمة لتدريب Dolphingemma؟

وفقًا لـ Google ، تم تدريب طراز AI على مجموعة بيانات WDP من الأصوات التي صنعتها Dolphin Wild Atlantic. يقال إن هذا المجتمع المحدد من الدلافين موجود في جزر البهاما ، وهو بلد جزيرة في منطقة البحر الكاريبي.

تستمر القصة أسفل هذا الإعلان

مجموعة البيانات المستخدمة لتدريب نموذج الذكاء الاصطناعي التي نشأت من لقطات الفيديو تحت الماء والتسجيلات الصوتية التي تم جمعها على مدار عقود. تم تصنيف هذه البيانات من قبل باحثو WDP لتحديد هويات الدلفين الفردية وكذلك تاريخ حياتهم والسلوكيات المرصودة.

بدلاً من إجراء ملاحظات سطحية ، ذهب باحثو WDP تحت الماء لجمع البيانات لأنهم وجدوا أنها ساعدتهم مباشرة على ربط الأصوات التي تصنعها الدلافين بسلوكياتهم المحددة.

تضم مجموعة بيانات تدريب Dolphingemma أصواتًا فريدة من الدلفين مثل صفارات التوقيع (التي تستخدمها الأمهات لاستدعاء العجول) ، وينفجر الصراخ (عادة ما يتم سماعها عندما تقاتل اثنان من الدلافين) ، وانقر فوق الطنانة (غالبًا ما يتم سماعها أثناء الخطبات أو مطاردة أسماك القرش).

كيفية استخدام نموذج Dolphingemma AI؟

من أجل إنشاء مفردات مشتركة لأصوات الدلفين ، قالت Google إنها تعاونت مع باحثو Georgia Tech لتطوير نظام الدردشة.

تستمر القصة أسفل هذا الإعلان

الدردشة قصيرة لقياس عن بُعد لزيادة السمع. إنه نظام كمبيوتر تحت الماء مصمم لربط أصوات الدلفين التي تم إنشاؤها بواسطة الذكاء الاصطناعى مع كائنات محددة تستمتع بها الدلافين مثل الأعشاب البحرية أو الأوشحة التي يستخدمها الباحثون.

قالت Google إن أداة الدردشة تتيح تفاعلًا في اتجاهين بين البشر والدلافين من خلال سماع صافرة الدلفين الصوتية بدقة تحت الماء ، وتحديد تسلسل مطابقة للصفارة الصوتية في مجموعة بيانات التدريب الخاصة بها ، وإبلاغ الباحث البشري (عبر سماعات الرأس تحت الماء) حول الكائن المقابل الذي طلبته الدلفين.

هذا من شأنه أن يمكّن الباحث من الاستجابة بسرعة من خلال تقديم الكائن الصحيح إلى الدلفين ، مما يعزز العلاقة بينهما ، على حد قول Google.

وأضافت الشركة: “من خلال إظهار النظام بين البشر ، يأمل الباحثون أن يتعلم الدلافين الفضوليين بشكل طبيعي محاكاة الصرارات لطلب هذه العناصر. في النهاية ، حيث يتم فهم المزيد من الأصوات الطبيعية للدلافين ، يمكن أيضًا إضافتها إلى النظام”.

تستمر القصة أسفل هذا الإعلان

https://www.youtube.com/watch؟v=yhopeqkbpza

قالت Google إن سلسلة Pixel 6 أظهرت أنها قادرة على معالجة أصوات الدلفين في الوقت الفعلي. وقالت إن جيل البكسل 9 القادم سيتم دمجه مع وظائف مكبر الصوت والميكروفون المحددة ، ويتم ترقيتها من خلال المعالجة المتقدمة “لتشغيل كل من نماذج التعلم العميق وخوارزميات مطابقة القوالب في وقت واحد.”

“إن استخدام الهواتف الذكية للبكسل يقلل بشكل كبير من الحاجة إلى أجهزة مخصصة ، ويحسن إمكانية صيانة النظام ، ويقلل من استهلاك الطاقة ويقلل من تكلفة الجهاز وحجمه – المزايا الحاسمة للبحث الميداني في المحيط المفتوح” ، قال عملاق التكنولوجيا.

هل يمكن أن تساعدنا AI chatbots في التحدث إلى الدلافين؟

يدرس الباحثون طرقًا للاستفادة من خوارزميات AI و Machined من أجل فهم أصوات الحيوانات لعدة سنوات حتى الآن.

لقد حققوا نجاحًا في تطبيق خوارزميات الكشف التلقائي على أساس الشبكات العصبية ” لالتقاط أصوات الحيوانات وتصنيفها بناء على خصائصهم الصوتية.

تستمر القصة أسفل هذا الإعلان

لقد جعلت الشبكات العصبية العميقة أيضًا إيجاد هياكل خفية في تسلسلات من صواريخ الحيوانات. وقد ضمن هذا أن نماذج الذكاء الاصطناعى المدربين على أمثلة لأصوات الحيوانات قادرة على توليد نسخة صناعية فريدة من صوت الحيوان.

في حين أن نماذج التعلم الخاضعة للإشراف هذه قادرة على توليد أصوات حيوانية بناءً على أمثلة ذات علامة الإنسان ، فماذا عن أصوات الحيوانات التي ليست جزءًا من مجموعة بيانات التدريب أو لم يتم تسميتها؟ هذا هو المكان الذي تأتي فيه نماذج التعلم الخاضعة للإشراف ذاتيا مثل chatgpt.

يتم تدريب نماذج التعلم غير الخاضعة للإشراف هذه على كميات هائلة من البيانات التي تم سحبها من كل زاوية وركن عبر الإنترنت. يتوقع الباحثون أن تحتوي مجموعات البيانات هذه على أصوات حيوانية لم يتم الوصول إليها مسبقًا.

ومع ذلك ، هناك العديد من التحديات الرئيسية في تطوير chatbot منظمة العفو الدولية التي تتيح للبشر التحدث إلى الحيوانات. على سبيل المثال ، أشار الباحثون إلى أن الحيوانات من المحتمل أن تتواصل باستخدام أكثر من مجرد صوت ، وتدمير حواس أخرى مثل اللمس والرائحة.




اكتشاف المزيد من موقع تجاربنا

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع تجاربنا

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading