قد تكون أداة وكيل OpenAI على وشك الإصدار

معلومات ذكية

Sunday, April 20 2025

قد تكون OpenAI على وشك إصدار أداة ذكاء اصطناعي يمكنها السيطرة على جهاز الكمبيوتر الخاص بك وأداء إجراءات نيابة عنك.

يدعي تيبور بلاهو ، مهندس برمجيات لديه سمعة بتسريب المنتجات القادمة بدقة ، أنه كشف عن أدلة على أداة المشغل الشائعة لفترة طويلة التي تقدمها OpenAI. ذكرت منشورات مثل بلومبرج في وقت سابق عن المشغل ، الذي يقال إنه نظام "متصرف" قادر على التعامل بشكل مستقل مع المهام مثل كتابة الشفرة وحجز السفر.

وفقًا لموقع The Information ، يستهدف OpenAI شهر يناير كشهر لإطلاق المشغل. يضيف الرمز الذي كشف عنه Blaho في نهاية هذا الأسبوع مصداقية لهذا التقرير.

عميل ChatGPT لـ macOS الخاص بشركة OpenAI قد اكتسب خيارات ، مخفية حاليًا ، لتعريف اختصارات لـ "تبديل المشغل" و "إجبار المشغل على الإنهاء" ، وفقًا لـ Blaho. وقد أضافت OpenAI إشارات إلى المبرمج على موقعها ، على حد قول Blaho - رغم أن الإشارات ليست مرئية للجمهور حتى الآن.

\n
تم التأكد من - تحتوي تطبيقات سطح المكتب ChatGPT macOS على خيارات مخفية لتعريف اختصارات لواجهة المستخدم لسطح المكتب على \"تبديل المشغل\" و \"إجبار المشغل على الإنهاء\" https://t.co/rSFobi4iPN pic.twitter.com/j19YSlexAS
\n
— تبور بلاهو (@btibor91) 19 يناير 2025
\n

وفقًا لـ Blaho ، يتضمن موقع OpenAI أيضًا جداول غير مرئية بعد تقارن أداء المشغل مع أنظمة الذكاء الاصطناعي الأخرى التي تستخدم الكمبيوتر. قد تكون الجداول عبارة عن أماكن فارغة. ولكن إذا كانت الأرقام دقيقة ، فإنها توحي بأن المشغل ليس موثوقاً بنسبة 100٪ ، اعتمادًا على المهمة.

\n
يحتوي موقع OpenAI ألفاظاً عن المشغل / OpenAI CUA (وكيل استخدام الكمبيوتر) - "جدول نظام المشغل" ، "جدول تقييم بحث المشغل" و "جدول معدل رفض المشغل"
\n
بما في ذلك مقارنة بـ Claude 3.5 Sonnet Computer Google Mariner ، إلخ.
\n
(معاينة الجداول... pic.twitter.com/OOBgC3ddkU
\n
— تبور بلاهو (@btibor91) 20 يناير 2025
\n

في OSWorld ، وهو معيار يحاكي بيئة حقيقية للكمبيوتر ، يحصل "وكيل استخدام الكمبيوتر OpenAI (CUA)" - وربما النموذج الذكائي الاصطناعي الذي يدعم المشغل - على نسبة 38.1٪ ، وهو متقدم على نموذج تحكم الكمبيوتر الخاص بـ Anthropic ولكنه لا يصل إلى نسبة البشر التي تصل إلى 72.4٪. يتجاوز OpenAI CUA الأداء البشري على WebVoyager ، الذي يقيم قدرة الذكاء الاصطناعي على التنقل والتفاعل مع المواقع. ولكن النموذج لا يصل إلى درجات مستوى الإنسان على معيار آخر معتمد على الويب ، WebArena ، وفقًا للمعايير المسربة.

يواجه المشغل أيضًا صعوبة في المهام التي يمكن للإنسان القيام بها بسهولة ، إذا كان التسرب صحيحًا. في اختبار طلب من المشغل التسجيل في مزود خدمة سحابي وإطلاق جهاز افتراضي ، نجح المشغل فقط 60٪ من الوقت. ومكلفًا بإنشاء محفظة Bitcoin ، نجح المشغل فقط 10٪ من الوقت.

لقد تواصلنا مع OpenAI للحصول على تعليق وسنقوم بتحديث هذا النص إذا سمعنا ردًا منهم.

يأتي دخول OpenAI المقبل في مجال وكلاء AI وسط تحركات منافسين من بينهم Athropic ، Google ، وغيرهم يسعون لاحتلال القطاع الناشئ. قد تكون وكلاء الذكاء الاصطناعي خطرة واستقرائية ، ولكن العمالقة التكنولوجيون يروجون لها بالفعل كأمر هام في مجال الذكاء الاصطناعي. وفقًا لشركة البحوث والتسويق Markets and Markets ، قد تصل قيمة سوق وكلاء الذكاء الاصطناعي إلى 47.1 مليار دولار بحلول عام 2030.

يعد الوكلاء اليوم نوعًا من الخدمات الأولية. ومع ذلك ، أثار بعض الخبراء مخاوف بشأن سلامتها ، في حال تحسن التكنولوجيا بسرعة.

إحدى الرسوم البيانية المسربة تظهر العمل الجيد الذي يقوم به المشغل في التقييمات الأمانية المحددة ، بما في ذلك الاختبارات التي تحاول النظام أداء "أنشطات غير قانونية" والبحث عن "البيانات الشخصية الحساسة". ويقال إن اختبار السلامة هو من بين الأسباب التي تعود إليها فترة التطوير الطويلة للمشغل. في منشور X حديث ، انتقد الشريك المؤسس لشركة OpenAI Wojciech Zaremba Anthropic لإصدار وكيل يفتقر إلى تلطيفات السلامة.

كتب زاريمبا: \"لا أستطيع سوى تخيل الردود السلبية إذا قامت OpenAI بإصدار مماثل.\"

من الجدير بالذكر أن OpenAI قد تعرضت لانتقادات من باحثين في مجال الذكاء الاصطناعي ، بما في ذلك الموظفين السابقين ، لتقليل العمل على السلامة على حساب بسرعة تسويق تقنيتها.

معلومات ذكية

قد تكون أداة وكيل OpenAI على وشك الإصدار

Recent Posts

الشمس تهزم الونكس

الحكومة التركية تحظر لعبة Roblox بسبب اتهامات استغلال الأطفال

تهديد جديد مروع من الذكاء الاصطناعي: استهداف مواقع 'التعري' من قبل السلطات في سان فرانسيسكو

أخطأ موظف DOGE في قسم الخزانة بإرسال بيانات شخصية غير مشفرة عبر البريد الإلكتروني

بوغارتس يحقق نقطة واحدة، وميريل يقوم بتصدير اللعبة في التاسعة مع البادريس الفوز على القراصنة 2-1