ماذا جربت بالضبط

قمت باختبار ميزة أتمتة المهام في Gemini على هاتفين: Pixel 10 Pro وGalaxy S26 Ultra. النسخة الحالية محدودة وهي في طور الاختبار. تعمل الميزة الآن مع عدد صغير من خدمات توصيل الطعام وخدمات النقل. الفكرة أنها تتعامل مع التطبيقات نيابة عنك وتنفذ الطلبات خطوة بخطوة.

كيف تعمل في الواقع

الأداء العام لا يزال بطيئاً. إذا أردت حجز توصيل أو سيارة فوراً، لا زلت أسرع من Gemini. لكن هناك نقطة مهمة: أتمتة المهام مصممة لتعمل في الخلفية أثناء قيامك بأشياء أخرى على الهاتف، وحتى عندما لا تنظر إلى الشاشة.

أثناء التنفيذ يظهر نص في أسفل الشاشة ليخبرك بما يجري. على سبيل المثال، طلبت وجبة دجاج تيرياكي وفهم Gemini أنني أريد وجبة واحدة رغم أن المطعم عرض حصص نصفية. البرنامج جمع حصتين نصفيتين ليكوّن حصة كاملة. مشاهدة النظام يتصرف مباشرة أمر مثير للاهتمام.

ملاحظات على السرعة والدقة

  • أحياناً يتعرّف Gemini على عناصر واضحة في الواجهة بشكل بطيء أو خاطئ، حتى لو كانت العنصر ظاهرًا في أعلى الشاشة.
  • في تجربة ترتيب التيرياكي استغرق تنفيذ الخطوات نحو تسع دقائق قبل أن يصل إلى الصفحة النهائية. هذا زمن طويل مقارنة بما يفعله الشخص بنفسه.
  • المبدأ المعتاد أن العملية تتوقف عند خطوة التأكيد النهائية حتى تراجع الطلب. هذا أمر جيد الآن، لأن الميزة لا تنهي الطلب تلقائياً.
  • الدقة النهائية جيدة نسبياً، وغالباً لا تحتاج لتعديلات كبيرة. المشاكل التي ظهرت كانت في الدقيقة الأولى عادة، مثل حاجة التطبيق لإذن الموقع أو أن عنوان التوصيل كان آخر مكان استخدمت التطبيق فيه.

حالات نجحت فيها الميزة

أحد أكثر المشاهد إقناعاً كان عندما طلبت من Gemini حجز أوبر للوصول إلى المطار لرحلة مفترضة في اليوم التالي. لأن Gemini لديه صلاحية الوصول إلى البريد الإلكتروني والتقويم، تمكن من إيجاد تفاصيل الرحلة. بعد بعض الإرشاد الطفيف اقترح أوقات مغادرة مناسبة وسأل إن كنت أرغب بحجز رحلة لأحد هذه الأوقات. بعد تأكيدي أتم الحجز في حوالي ثلاث دقائق دون تدخل إضافي.

هذا النوع من الأعمال يبرز الفرق بين مجرد أوامر صوتية أو مؤقتات، وبين مساعد قادر على ربط معلومات من مصادر متعددة وتنفيذ مهمة كاملة تقريباً.

لماذا الواجهات الحالية ليست مثالية لهذه الميزة

التطبيقات اليوم مصممة للبشر. لك أن تتخيل أن المساعد الآلي يتصفح صفحات مليئة بالإعلانات والصور الكبيرة لمحاولة إيجاد زر محدد. من الضروري أن تتطور واجهات التطبيقات لتقديم بيانات منظمة للآلات، وليس صفحات مرئية مخصصة للعين البشرية فقط.

هناك مبادرات فنية تعمل نحو هذا الهدف مثل بروتوكولات لتقديم سياق نماذج الذكاء الاصطناعي وميزات نظام أندرويد المخصصة للتكامل. وفق ما قاله مسؤول أندرويد في Google، Gemini يعتمد أسلوب الاستدلال عبر واجهات التطبيقات عندما لا تتوفر طرق أكثر مرونة من المطورين.

الاستنتاج: مفيد لكنه في بداياته

النسخة الحالية من أتمتة المهام تبدو كحل مؤقت. هي بطيئة ومعرّضة للخطأ، ولا تشرح دائماً سبب فشلها عندما تقع مشكلة. لكنها أيضاً تقدم لمحة واضحة عن ما يمكن أن تفعله مساعدات ذكية تعمل داخل الهاتف. باختصار، تجربة غير متقنة لكنها تحمل وعداً واضحاً.

الخلاصة: أداة مفيدة في مهام معينة، تحتاج تطبيقات ومطوّرين أفضل لتصبح عملية وسريعة.