
قد تكون OpenAI على وشك إصدار أداة ذكاء اصطناعي يمكنها السيطرة على جهاز الكمبيوتر الخاص بك وأداء إجراءات نيابة عنك.
\nيدعي تيبور بلاهو ، مهندس برمجيات لديه سمعة بتسريب المنتجات القادمة بدقة ، أنه كشف عن أدلة على أداة المشغل الشائعة لفترة طويلة التي تقدمها OpenAI. ذكرت منشورات مثل بلومبرج في وقت سابق عن المشغل ، الذي يقال إنه نظام "متصرف" قادر على التعامل بشكل مستقل مع المهام مثل كتابة الشفرة وحجز السفر.
\nوفقًا لموقع The Information ، يستهدف OpenAI شهر يناير كشهر لإطلاق المشغل. يضيف الرمز الذي كشف عنه Blaho في نهاية هذا الأسبوع مصداقية لهذا التقرير.
\nعميل ChatGPT لـ macOS الخاص بشركة OpenAI قد اكتسب خيارات ، مخفية حاليًا ، لتعريف اختصارات لـ "تبديل المشغل" و "إجبار المشغل على الإنهاء" ، وفقًا لـ Blaho. وقد أضافت OpenAI إشارات إلى المبرمج على موقعها ، على حد قول Blaho - رغم أن الإشارات ليست مرئية للجمهور حتى الآن.
\n\n\nتم التأكد من - تحتوي تطبيقات سطح المكتب ChatGPT macOS على خيارات مخفية لتعريف اختصارات لواجهة المستخدم لسطح المكتب على \"تبديل المشغل\" و \"إجبار المشغل على الإنهاء\" https://t.co/rSFobi4iPN pic.twitter.com/j19YSlexAS
\n— تبور بلاهو (@btibor91) 19 يناير 2025
\n
وفقًا لـ Blaho ، يتضمن موقع OpenAI أيضًا جداول غير مرئية بعد تقارن أداء المشغل مع أنظمة الذكاء الاصطناعي الأخرى التي تستخدم الكمبيوتر. قد تكون الجداول عبارة عن أماكن فارغة. ولكن إذا كانت الأرقام دقيقة ، فإنها توحي بأن المشغل ليس موثوقاً بنسبة 100٪ ، اعتمادًا على المهمة.
\n\n\nيحتوي موقع OpenAI ألفاظاً عن المشغل / OpenAI CUA (وكيل استخدام الكمبيوتر) - "جدول نظام المشغل" ، "جدول تقييم بحث المشغل" و "جدول معدل رفض المشغل"
\nبما في ذلك مقارنة بـ Claude 3.5 Sonnet Computer Google Mariner ، إلخ.
\n(معاينة الجداول... pic.twitter.com/OOBgC3ddkU
\n— تبور بلاهو (@btibor91) 20 يناير 2025
\n
في OSWorld ، وهو معيار يحاكي بيئة حقيقية للكمبيوتر ، يحصل "وكيل استخدام الكمبيوتر OpenAI (CUA)" - وربما النموذج الذكائي الاصطناعي الذي يدعم المشغل - على نسبة 38.1٪ ، وهو متقدم على نموذج تحكم الكمبيوتر الخاص بـ Anthropic ولكنه لا يصل إلى نسبة البشر التي تصل إلى 72.4٪. يتجاوز OpenAI CUA الأداء البشري على WebVoyager ، الذي يقيم قدرة الذكاء الاصطناعي على التنقل والتفاعل مع المواقع. ولكن النموذج لا يصل إلى درجات مستوى الإنسان على معيار آخر معتمد على الويب ، WebArena ، وفقًا للمعايير المسربة.
\nيواجه المشغل أيضًا صعوبة في المهام التي يمكن للإنسان القيام بها بسهولة ، إذا كان التسرب صحيحًا. في اختبار طلب من المشغل التسجيل في مزود خدمة سحابي وإطلاق جهاز افتراضي ، نجح المشغل فقط 60٪ من الوقت. ومكلفًا بإنشاء محفظة Bitcoin ، نجح المشغل فقط 10٪ من الوقت.
\nلقد تواصلنا مع OpenAI للحصول على تعليق وسنقوم بتحديث هذا النص إذا سمعنا ردًا منهم.
\nيأتي دخول OpenAI المقبل في مجال وكلاء AI وسط تحركات منافسين من بينهم Athropic ، Google ، وغيرهم يسعون لاحتلال القطاع الناشئ. قد تكون وكلاء الذكاء الاصطناعي خطرة واستقرائية ، ولكن العمالقة التكنولوجيون يروجون لها بالفعل كأمر هام في مجال الذكاء الاصطناعي. وفقًا لشركة البحوث والتسويق Markets and Markets ، قد تصل قيمة سوق وكلاء الذكاء الاصطناعي إلى 47.1 مليار دولار بحلول عام 2030.
\nيعد الوكلاء اليوم نوعًا من الخدمات الأولية. ومع ذلك ، أثار بعض الخبراء مخاوف بشأن سلامتها ، في حال تحسن التكنولوجيا بسرعة.
\nإحدى الرسوم البيانية المسربة تظهر العمل الجيد الذي يقوم به المشغل في التقييمات الأمانية المحددة ، بما في ذلك الاختبارات التي تحاول النظام أداء "أنشطات غير قانونية" والبحث عن "البيانات الشخصية الحساسة". ويقال إن اختبار السلامة هو من بين الأسباب التي تعود إليها فترة التطوير الطويلة للمشغل. في منشور X حديث ، انتقد الشريك المؤسس لشركة OpenAI Wojciech Zaremba Anthropic لإصدار وكيل يفتقر إلى تلطيفات السلامة.
\nكتب زاريمبا: \"لا أستطيع سوى تخيل الردود السلبية إذا قامت OpenAI بإصدار مماثل.\"
\nمن الجدير بالذكر أن OpenAI قد تعرضت لانتقادات من باحثين في مجال الذكاء الاصطناعي ، بما في ذلك الموظفين السابقين ، لتقليل العمل على السلامة على حساب بسرعة تسويق تقنيتها.