روبن لي يُعلن نهاية عصر النموذج — فيديو الذكاء الاصطناعي يُثبت ذلك منذ أشهر

· Chris Sherman

افتتح الرئيس التنفيذي لـ Baidu Create 2026 في بكين اليوم بسحب سؤال "أي نموذج هو الأفضل؟" من جدول الأسئلة المهمة. بالنسبة لفيديو الذكاء الاصطناعي، هذا مجرد ترسيم رسمي لإجماع عمره أربعة أشهر.

الجملة التي أعادت تأطير الصناعة

وقف روبن لي، الشريك المؤسس والرئيس التنفيذي لـ Baidu، على منصة Baidu Create 2026 في بكين في 14 مايو 2026 وأدلى بجملة ستُقتبس في بقية العام: صناعة الذكاء الاصطناعي، قال، تجاوزت "تنافس النماذج" ودخلت "عصر الوكلاء". أرفقها باقتراح ملموس - يجب أن يكون المؤشر الجديد Daily Active Agents (DAA)، نظير DAU في عصر الوكلاء، مع توقع تجاوز DAA العالمي 10 مليار في النهاية.

إن كنت تتابع سوق فيديو الذكاء الاصطناعي خلال الأشهر الأربعة الماضية، فلا شيء من هذا توقع. إنه وصف.

انهار Sora 2 في 84 يومًا تحت وطأة استراتيجية النموذج الفردي. حصد HappyHorse 1.0 المركز الأول في Arena خلال 48 ساعة وقلّص فورًا الفجوة التقنية الجوهرية بين نماذج الفيديو الرائدة إلى ما يقارب الصفر. تتقارب Seedance 2.0 و Veo 3.1 وتسريب Gemini Omni جميعًا على نفس نقطة الوصول المعمارية. توقف سؤال "أي نموذج هو الأفضل؟" عن كونه مثيرًا في وقت ما بين فبراير وأبريل. اليوم، أصبح روبن لي أول رئيس تنفيذي لمنصة كبرى يقول ذلك علنًا.

هذا المقال عما يعنيه ذلك تحديدًا لفيديو الذكاء الاصطناعي - ما قاله لي، ما شحنته Baidu فعلًا اليوم، ولماذا تتبيّن كلمة رئيسية حول طبقة التطبيق في بكين أنها الوصف الأدق الذي لدينا لمشهد المنافسة في النصف الثاني من 2026.

ما قاله لي فعلًا

1. "نظرية تطور الذكاء الاصطناعي" - تحول من ثلاث طبقات

عرض لي ما أسماه "نظرية تطور الذكاء الاصطناعي": تحول متزامن في ثلاث طبقات. الوكلاء يتطورون من مُجيبين سلبيين إلى منفذين مستقلين يتعلمون باستمرار من البيئة. الأفراد يتطورون من مستخدمين عاديين إلى "أفراد فائقين" يتعايشون مع AI لمضاعفة إنتاجهم. المؤسسات تتطور من تعاون إنسان-إنسان إلى تشكيلات مختلطة إنسان-وكيل تعمل كمنظمات فائقة موحدة.

بنزع الغلاف البلاغي، الجوهر واضح: هجرة القيمة تبتعد عن قدرة النموذج الخام وتتجه نحو الطبقة التي تنظّم القدرة في نتائج. تلك هي طبقة الوكيل.

2. Daily Active Agents (DAA) - مؤشر جديد

اقترح لي DAA كخلف عصر-الوكلاء لـ DAU. الحجة: الرموز تقيس التكلفة، لا القيمة - مؤشر إدخال لا إخراج. الوكلاء النشطون يقيسون كم مرة تقوم برامج مستقلة بعمل مفيد لشخص ما. توقّع أن يتجاوز DAA العالمي 10 مليار في النهاية.

3. "البرمجيات القابلة للاستخدام مرة واحدة" - تطبيقات كقطع قابلة للتخلص

الخيط الثالث: مع انهيار تكاليف توليد الكود، تنخفض حواجز تطوير البرمجيات وتصبح التطبيقات لمرة واحدة قابلة للتطبيق. يولد المستخدمون برمجيات مخصصة لمهمة واحدة ويتخلصون منها. استشهد لي بوكيل البرمجة Miaoda من Baidu - الذي يُقال إنه يولد حوالي 90% من كوده الخاص - كمثال عملي.

ما شحنته Baidu اليوم فعلًا

المنتجماذالماذا يهم
DuMateوكيل لأغراض عامة - منتج الوكيل الأفقي الرائد لـ Baiduضربة مباشرة لـ Operator/ChatGPT-as-agent من OpenAI
Miaoda (app + المؤسسة)وكيل برمجة يولد ~90% من كوده الخاصتجسيد أطروحة "البرمجيات لمرة واحدة"
Baidu YiJing (محدث)منصة بشر رقميين متعددة الوكلاء للبث المباشر وتوليد الفيديو الفوريالإطلاق الأكثر صلة مباشرة بصانعي محتوى فيديو AI
Famou Agent 2.0منصة وكلاء ذاتية التطورالاستقلالية بالتعلم المستمر هي خطة DAA طويلة المدى

المثير في موضوعنا هو YiJing. منصة متعددة الوكلاء لبشر رقميين - يعني النظام ليس نموذج فيديو وحيد بواجهة دردشة ملصقة عليه، بل طبقة تنسيق تنسّق عدة وكلاء متخصصين للبث والتوليد الفوري: وكيل للنص، وكيل للأداء وتزامن الشفاه، وكيل للكاميرا واختيار اللقطة، وكيل لاستجابة الجمهور، وكيل لمنطق المنتج/الترويج. نموذج الفيديو في مكان ما أسفل ذلك، كمكوّن قابل للتبديل.

لماذا الآن، لا قبل ستة أشهر

  1. الانهيار الاقتصادي لـ Sora 2. أُغلق نموذج OpenAI الرائد لفيديو المستهلكين في 84 يومًا. التحليل اللاحق.
  2. الصعود الفوري لـ HappyHorse 1.0. نموذج Alibaba الموحد للصوت-الفيديو حصد Arena #1 في 48 ساعة. المراجعة.
  3. التقارب المعماري. Seedance 2.0 و HappyHorse 1.0 و Gemini Omni المسرّب تشير جميعًا إلى نفس الوجهة.
  4. ضغط الأسعار. أسعار API لفيديو الفئة العليا من 0.50$/ث (Veo 3.1) إلى 0.05$/ث (HappyHorse 1.0).

لم يتنبأ لي بالتحول. سمّاه.

ما يعنيه عصر الوكلاء فعلًا لفيديو AI

1. سؤال "أي نموذج يجب أن أستخدم؟" بات قديمًا

السؤال الصحيح هو "أي مجموعة وكلاء تُوجِّه عملي إلى أفضل نموذج لكل لقطة؟". قد يكون Veo 3.1 الأفضل للحركة عالية الفيزياء. HappyHorse 1.0 للكلام المتزامن. Seedance 2.0 لتسلسلات متعددة اللقطات. Kling 3.0 للأسلوبية. مهمة الوكيل أن يعرف ويوجّه تلقائيًا.

2. جودة الإخراج لم تعد تتعلق بقدرة النموذج

تصبح متعلقة بجودة ترجمة المطالبة، تحليل اللقطات، إدارة الاستمرارية، التحقق من تزامن الصوت والفيديو - أشياء لا يفعلها النموذج وحده جيدًا.

3. تنتقل وحدة التفرقة من "النموذج" إلى "سير العمل"

إن كنت أداة، فأنت لا تنافس على "نستخدم Veo 3.1". تنافس على ما يفعله وكيلك فوق Veo 3.1 و Seedance 2.0 و HappyHorse و Kling و Luma و Runway مجتمعة. الأطروحة المحورية لـ حصاد منتصف 2026.

4. DAA يعيد تأطير مؤشر النجاح لأدوات صانعي المحتوى

الأدوات المُحسَّنة لـ DAU تدفع المستخدم نحو العبث - مزيد من التكرارات والأزرار وإعادات التصيير. الأدوات المُحسَّنة لـ DAA تدفع نحو التفويض - تفاعلات أقل، استقلالية أعلى، عمل أكثر إنجازًا في الجلسة.

5. "الوكلاء القابلون للتخلص" يصبحون وحدة العمل الإبداعي

بدلًا من أداة دائمة بإعدادات مستمرة، يحصل كل مشروع على وكيل مخصص - مُجمَّع للموجز، مُحسَّن للقيد، مُذاب عند التسليم.

ماذا يعني هذا لك تحديدًا

إن كنت صانع محتوى فرديًا

توقف عن قياس النماذج. ابدأ بقياس سير العمل. السؤال المفيد في الستين يومًا القادمة ليس "هل HappyHorse أفضل من Veo؟" - بل "هل أداتي الحالية تُوجِّه بين النماذج بذكاء، أم أنني أفعل ذلك يدويًا؟".

إن كنت تبني منتج فيديو

عامِل تكاملات النموذج كإعدادات لا كود. وتيرة الإصدارات تضمن أن الترميز الصارم لنموذج محدد قنبلة موقوتة بستة أشهر.

إن كنت تدير فريقًا إبداعيًا مؤسسيًا

"التشكيلات المختلطة إنسان-وكيل" عند لي ليست شعارًا. إنها هدف تشغيلي ملموس.

ثلاث إشارات يجب مراقبتها من هنا

الإشارة 1: Google I/O 2026 (19-20 مايو)

إن صدر Gemini Omni كنموذج موحد متعدد الوسائط بواجهة وكيل أصلية، فإن Google يصادق ضمنيًا على نفس الأطروحة.

الإشارة 2: جلسة Hailuo/MiniMax (29 مايو)

ديزني وWarner Bros. وNBCUniversal ضد MiniMax أمام القاضي Blumenfeld في 29 مايو.

الإشارة 3: تبني DAA من المنصات الكبرى

راقب إن تبنّت OpenAI أو Anthropic أو Meta أو Google مؤشر DAA (أو مكافئًا للاستقلالية) في إفصاحاتها الفصلية القادمة.

الخلاصة

الأكثر فائدة في كلمة لي يوم 14 مايو ليس أنه أعلن منتجات جديدة - فـ DuMate و Miaoda و YiJing ردود بصياغة Baidu على نمط كان موجودًا. الأكثر فائدة هو أنه أعطى اسمًا ومؤشرًا لتحوّل كان يحدث بهدوء في سوق فيديو AI لأربعة أشهر.

طبقة النموذج تستمر في الحركة. ستستمر. Gemini Omni الأسبوع المقبل، Seedance 3 في الربع الثالث، أيًا كان ما تشحنه Anthropic و Meta حتى نهاية العام. لن يستقر شيء. وهذه بالضبط النقطة. حين تكون طبقة النموذج في حركة دائمة، فإن المكان الوحيد المستدام للبناء يقع طبقة أعلى - على طبقة الوكلاء، حيث تتراكم سير العمل وتتحسن التنسيقات مع الاستخدام.

بالنسبة لفيديو AI، ليس هذا تخمينًا. نعمل بهذه الأطروحة منذ بداية 2026، ولهذا تم بناء Genra كوكيل من البداية إلى النهاية فوق Veo + Seedance بدلًا من واجهة أمامية لنموذج واحد. وظيفة الوكيل هي التوجيه إلى النموذج الصحيح، إدارة الاستمرارية عبر اللقطات، مزامنة الصوت والحركة، وتسليم القطع النهائية دون أن يجعلك أنت محرك التوجيه. كلمة لي هي أوضح تصديق علني على هذا الخيار المعماري حصلنا عليه هذا العام.

خمسة أيام حتى Google I/O. خمسة عشر حتى جلسة MiniMax. الأسبوعان القادمان سيخبرانك بمدى موافقة الصناعة على ما قاله لي اليوم في بكين.

الأسئلة الشائعة

ما هو Baidu Create 2026؟

المؤتمر السنوي لمطوري الذكاء الاصطناعي في Baidu، 13-14 مايو 2026 في بكين. استخدم الرئيس التنفيذي روبن لي كلمة 14 مايو لإعلان عصر الوكلاء واقتراح DAA كمؤشر جديد.

ماذا أعلن روبن لي بالضبط؟

أربعة منتجات: DuMate (وكيل عام)، Miaoda app + المؤسسة (~90% توليد ذاتي)، Baidu YiJing المُحدّث، وFamou Agent 2.0. بالإضافة إلى مؤشر DAA ونظرية تطور AI من ثلاث طبقات.

ما هي Daily Active Agents (DAA)؟

نظير DAU في عصر الوكلاء. تقيس كم وكيلًا مستقلًا يقوم بعمل مفيد يوميًا. توقع لي تجاوز 10 مليار عالميًا.

لماذا يهم تحديدًا لفيديو AI؟

أثبت فيديو AI الأطروحة تجريبيًا في أربعة أشهر - انهار Sora 2 وأغلق HappyHorse 1.0 الفجوة في 48 ساعة وضُغطت أسعار API العليا 10 أضعاف.

كيف تنطبق "البرمجيات لمرة واحدة" على الفيديو؟

على الفيديو: مجموعات وكلاء خاصة بالمشروع بدلًا من أدوات دائمة.

ماذا يجب أن أفعل كصانع محتوى؟

التوقف عن قياس النماذج بمعزل والبدء بقياس سير العمل.


عن الكاتب
Chris Sherman يغطي تقنية فيديو AI وسير عمل الإنتاج الإبداعي. تابع @GenraAI للتغطية المباشرة لـ Google I/O 2026 (19-20 مايو) وجلسة MiniMax (29 مايو).