DeepMind تدعي أن نظامها الذكاء الاصطناعي يعمل بشكل أفضل من الحائزين على ميداليات مسابقة الرياضيات الدولية

\n

نظام الذكاء الاصطناعي الذي طورته شركة DeepMind التابعة لجوجل، وهي أحد أبرز مختبرات الذكاء الاصطناعي لجوجل، يبدو أنه تجاوز المتوسط ​​للفائزين بميداليات ذهبية في حل مشاكل الهندسة في مسابقة رياضية دولية.

\n

النظام، المسمى AlphaGeometry2، هو نسخة محسنة من نظام AlphaGeometry الذي أصدرته DeepMind في يناير الماضي. في دراسة نشرت حديثًا، يدعي الباحثون في DeepMind وراء AlphaGeometry2 أن نظامهم الذكاء الاصطناعي يستطيع حل 84٪ من جميع مشاكل الهندسة على مدى السنوات الـ 25 الماضية في مسابقة الرياضيات الدولية (IMO)، وهي مسابقة رياضية لطلاب المدارس الثانوية.

\n
\n\t
\n\t
\n
\n
\n\t
\n\t
\n
\n

لماذا تهتم DeepMind بمسابقة رياضية على مستوى الثانوية؟ حسنًا، يرى المختبر أن مفتاح تطوير نماذج الذكاء الاصطناعي الأكثر قدرة قد يكمن في اكتشاف طرق جديدة لحل مشاكل الهندسة الصعبة - على وجه الخصوص مشاكل الهندسة اليوكليدية.

\n

تثبت القطع الرياضية، أو شرح سبب صحة نظرية رياضية، مهارتي الاستدلال والقدرة على اختيار من مجموعة من الخطوات المحتملة نحو الحل. قد تتبين أن هذه المهارات في حل المشاكل يمكن أن تثبت أنها جزء مفيد من نماذج الذكاء الاصطناعي العامة المستقبلية إذا كان DeepMind على حق.

\n

في الواقع، خلال هذا الصيف الماضي، قدمت DeepMind نظامًا قام فيه بجمع AlphaGeometry2 مع AlphaProof، وهو نموذج ذكاء اصطناعي للإثبات الرياضي الرسمي، لحل أربعة من ستة مشاكل من IMO 2024. بالإضافة إلى مشاكل الهندسة، يمكن توسيع النهج مثل هذه إلى مجالات أخرى من الرياضيات والعلوم - على سبيل المثال، للمساعدة في حسابات الهندسة المعقدة.

\n

يحتوي AlphaGeometry2 على عناصر أساسية عدة، بما في ذلك نموذج لغة من عائلة نماذج الذكاء الاصطناعي Gemini لجوجل و"محرك رمزي". يساعد نموذج Gemini المحرك الرمزي، الذي يستخدم القواعد الرياضية للاستدلال على الحلول للمشاكل، على الوصول إلى دلائل جديرة بالاعتماد لنظرية هندسية معينة.

\n
مخطط مشكلة هندسية نموذجي في امتحان IMO.شتائم الصورة: جوجل (يفتح في نافذة جديدة)

تعتمد مشاكل الهندسة الأولمبية على مخططات تحتاج إلى إضافة \"منشآت\" قبل أن يمكن حلها، مثل النقاط والخطوط أو الدوائر. يتنبأ نموذج Gemini لـ AlphaGeometry2 بالمنشآت التي قد تكون مفيدة لإضافتها إلى المخطط، حيث يستشير المحرك هذه المنشآت لاستنتاج.

\n
\n
\n

ببساطة، يقترح نموذج Gemini الخطوات والإنشاءات في لغة رياضية رسمية للمحرك، الذي - باتباع قواعد محددة - يتحقق من هذه الخطوات من حيث المنطقية. يسمح خوارزمية البحث لـ AlphaGeometry2 بإجراء بحث متعدد للحلول بشكل متواز وتخزين النتائج المحتملة في قاعدة معرفة مشتركة.

\n

يعتبر AlphaGeometry2 أن المشكلة قد \"حُلت\" عندما يصل إلى إثبات يجمع بين اقتراحات نموذج Gemini مع مبادئ المحرك الرمزي.

\n

نظرًا لتعقيدات ترجمة الأدلة إلى شكل يمكن للذكاء الاصطناعي فهمه، هناك نقص في بيانات تدريب الهندسة. لذلك قامت DeepMind بإنشاء بيانات تدريبية اصطناعية خاصة بها لتدريب نموذج لغة AlphaGeometry2، بإنشاء أكثر من 300 مليون نظرية وبراهين بتعقيدات متفاوتة.

\n
\n\t
\n\t
\n
\n
\n\t
\n\t
\n
\n

اختار فريق DeepMind 45 مشكلة هندسة من مسابقات IMO على مدى الـ 25 عامًا الماضية (من 2000 إلى 2024)، بما في ذلك معادلات خطية ومعادلات تتطلب نقل الكائنات الهندسية حول مستوى. ثم "ترجموا" هذه إلى مجموعة أكبر من 50 مشكلة. (لأسباب فنية، كانت يتعين تقسيم بعض المشاكل إلى اثنين.)

\n

وفقًا للورقة، حل AlphaGeometry2 42 من أصل 50 مشكلة، متجاوزًا درجة الفائز بالميدالية الذهبية المتوسطة التي بلغت 40.9.

\n

من الواضح أن هناك قيودًا. ميزة تقنية تمنع AlphaGeometry2 من حل المشاكل التي تحتوي على عدد متغير من النقاط، معادلات غير خطية، وعدم المساواة. وAlphaGeometry2 ليست بشكل تقني أول نظام ذكاء اصطناعي يصل إلى أداء على مستوى الميدالية الذهبية في الهندسة، على الرغم من أنها الأولى التي تحقق ذلك بمجموعة مشاكل بهذا الحجم.

\n

كما قامت فريق DeepMind بعمل أسوأ على مجموعة أخرى من المشاكل الصعبة من IMO. لإضافة تحدي أكبر، اختار فريق DeepMind مشاكل - بلغ عددها 29 - تم ترشيحها لامتحانات IMO من قبل خبراء الرياضيات، لكنها لم تظهر بعد في مسابقة. لم تتمكن AlphaGeometry2 سوى من حل 20 منها.

\n

ومع ذلك، من المحتمل أن تشعل نتائج الدراسة الجدل حول ما إذا كان يجب بناء أنظمة الذكاء الاصطناعي على التلاعب الرمزي - أي تلاعب الرموز التي تمثل المعرفة باستخدام قواعد - أو الشبكات العصبية التي تشبه الدماغ بشكل أكبر.

\n

يتبنى AlphaGeometry2 نهجًا مختلطًا: يحتوي نموذج Gemini له على تصميم شبكة عصبية، بينما محركه الرمزي يعتمد على القواعد.

\n

يقول أنصار تقنيات الشبكات العصبية أن السلوك الذكي، من التعرف على الكلام إلى توليد الصور، يمكن أن ينبثق من لا شيء سوى كميات هائلة من البيانات والحوسبة. معارضو الأنظمة الرمزية، التي تحل المهام عن طريق تحديد مجموعات من قواعد تلاعب الرموز مكرسة لوظائف معينة، مثل تحرير سطر في برنامج معالج النصوص، يحاولون حل المهام من خلال التقريب الإحصائي والتعلم من الأمثلة.

\n

تعتبر الشبكات العصبية الأساس لأنظمة الذكاء الاصطناعي القوية مثل نموذج الاستدلال المفتوح من o1 الخاص بـ OpenAI. ولكن، يزعم أنصار الذكاء الاصطناعي الرمزي، أنهم ليسوا الحل النهائي؛ قد يكون الذكاء الاصطناعي الرمزي قادرًا على ترميز معرفة العالم بكفاءة أكبر، والتفكير بها عبر سيناريوهات معقدة، و"شرح" كيف وصلوا إلى جواب.

\n
\n\t
\n\t
\n
\n
\n\t
\n\t
\n
\n

\"من المدهش رؤية التباين بين التقدم المتواصل والمذهل في هذه الاختبارات النوعية، وفي الوقت نفسه، مع النماذج اللغوية، بما في ذلك النماذج الأكثر حداثة مع \"الاستدلال\"، واصل طريقه إلى معضلات بعض المشاكل البسيطة جدًا في الحياة اليومية\"، وقال فنس كونيتزر، عضو هيئة التدريس في علوم الكمبيوتر بجامعة كارنيجي ميلون المتخصص في الذكاء الاصطناعي لـ TechCrunch. \"لا أعتقد أن كلها هي مجرد شُبه، ولكنه يوضح أننا لا نزال لا نعرف حقًا ما السلوك الذي نتوقعه من النظام القادم. من المرجح أن يكون هذه الأنظمة لها تأثيرات كبيرة، لذلك نحتاج بشكل عاجل إلى فهمها والمخاطر التي تمثلها بشكل أفضل\".

\n

ربما يثبت AlphaGeometry2 أن الطريقة التي تجمع فيها النهجين - تلاعب الرموز والشبكات العصبية - هي طريق واعد إلى الأمام في البحث عن الذكاء الاصطناعي قابل للتعميم. في الواقع، وفقًا للورقة التي أعدها DeepMind، لم يتمكن o1، الذي يحتوي أيضًا على تصميم شبكة عصبية، من حل أي من المشاكل IMO التي تمكن AlphaGeometry2 من الإجابة عليها.

\n

قد لا يكون هذا هو الحال إلى الأبد. في الورقة، قال فريق DeepMind إنه وجد أدلة أولية تُظهر أن نموذج اللغة الخاص بـ AlphaGeometry2 كان قادرًا على توليد حلول جزئية للمشاكل دون مساعدة من المحرك الرمزي.

\n

\"[النتائج] تدعم أفك