شركة Meta تطلق نموذج LLaMA 4 القائم على اللغة الصوتية للتفاعل الطبيعي مع المستخدمين حول العالم ويتحدى نماذج كبرى بقدرات محسنة

مېتا تطلق LLaMA 4: نموذج صوتي متعدد الوسائط يتحدى رواد الذكاء الاصطناعي

في قلب التطور: ما الجديد في LLaMA 4؟

أعلنت Meta Platforms في 5 أبريل 2025 عن إصدارها لنموذج الذكاء الاصطناعي الرابع، LLaMA 4، الذي يُعد القفزة الأكبر في خط إنتاجها من النماذج اللغوية، فهو قادر على معالجة النصوص، الصور، الفيديو والصوت ضمن إطار وسائط متعددة متكاملة.

أُتيحت نسختان من LLaMA 4 للمطورين والمجتمع العلمي: Scout وMaverick، بينما تستمر النسخة الأضخم داخليًا باسم Behemoth، والتي تُستخدم كمعلم لتدريب النسخ الأخرى.

Scout وMaverick: قدرات مفتوحة ومنهجيات متطورة

Scout: نموذج خفيف يتضمن حوالي 17 مليار معلمة نشطة ضمن 109 مليار، ويدعم نافذة سياق تصل إلى 10 ملايين رمز (tokens)، ما يتيح له فهم مستندات ضخمة وسياقات طويلة.

Maverick: يعتمد على بنية Mixture‑of‑Experts (MoE) ويضم 128 خبيرًا مع أكثر من 400 مليار معلمة إجمالية، مع 17 مليار معلمة نشطة فقط في كل تفعيل. صُمّم لتعزيز قدرات التفكير المنطقي والمعالجة المعقدة للوسائط، وتنافس النماذج مثل GPT‑4o وGemini بحسب مؤشرات Benchmark.

النسختان متاحتان كمصادر مفتوحة، مما يمثّل خيارًا جديدًا لمن يرغبون في بناء تطبيقات صوتية أو وسيطة دون تكاليف ترخيص باهظة.

التفاعل الصوتي بالطريقة الطبيعية

خلافًا للنماذج التي تعتمد على النص كوسيط، تدعم LLaMA 4 التفاعل الصوتي “طبيعي المصدر” (native speech)؛ حيث يمكن للمستخدمين التحدث مباشرة إلى النظام، وتلقي الرد الصوتي بدون المرور بواجهة نصية. هذا يعكس توجهًا جديدًا في تصميم الذكاء الاصطناعي نحو الحوار الحقيقي، دون الحاجز بين الكلام والنص.

تحديات وتأخيرات في طريق الإطلاق

ذكرت تقارير مبكرة أن إصدار LLaMA 4 تأخر مرتين، إذ واجه النموذج صعوبات في تحقيق المعايير التقنية المتعلقة بالتفكير المنطقي والمهام الحسابية، إضافة إلى تحفّظات بشأن أدائه في المحادثة الصوتية البشرية مقارنة بنماذج مثل GPT‑4o . مع ذلك، أطلقت الشركة النسخ المتاحة بعد تحسينات ملحوظة.

ميزانية ضخمة لاستثمار ضخم في الذكاء الاصطناعي

في إطار هذا التوجه، أعلنت Meta عن خطط لإنفاق ما بين 60 إلى 65 مليار دولار في عام 2025 على تعزيز البنية التحتية للذكاء الاصطناعي، بما في ذلك السيرفرات، الحوسبة، وتوظيف مئات الأبحاث والمهندسين في المجال.

الأداء مقابل المنافسين في ساحة الذكاء الاصطناعي

وفق Meta، تُظهر LLaMA 4 أداءً أفضل من GPT‑4o في بعض اختبارات LMArena، رغم أن النسخة المستخدمة للقياس كانت نسخة محسّنة ومختلفة عن تلك المتاحة للعامة. أثار هذا الأمر جدلًا حول الشفافية والأساليب المستخدمة في تحسين النتائج.

انعكاسات استراتيجية على قطاع التكنولوجيا

المجتمع المفتوح للمطورين: من خلال النموذج مفتوح الوزن، تُقدّم Meta منصة مفتوحة أمام الشركات الصغيرة والباحثين للعمل على تطبيقات صوتية تفاعلية دون تكلفة ترخيص.

تعزيز التمكين الصوتي: يمهد LLaMA 4 الطريق لتطبيقات تعتمد على الذكاء الصوتي، مثل المساعدات الذكية في الأجهزة المحمولة أو نظارات الواقع المعزز.

ضغوط تنافسية متزايدة: مع انتشار LLaMA 4 ووجودها كمصدر حر تقريبًا، فإنها تُحدي لاعبين كبار مثل Google وOpenAI على مستوى التبني المجتمعي والابتكار المجاني.

قيود الترخيص ونطاق الاستخدام

رغم الطرح المفتوح، فإن Meta فرضت قيودًا مثل منع المؤسسات التي تخدم أكثر من 700 مليون مستخدم دون ترخيص رسمي، وكذلك حظر استخدام النموذج مباشرة في الاتحاد الأوروبي لأسباب تنظيمية. أثار ذلك أسئلة حول مدى "انفتاح" النموذج فعليًا، خاصة أن بعض المستخدمين يقولون: "هل يستطيع النموذج أن يكون مفتوحًا إذا لا يسمح باستخدامه في منطقة كالـ EU؟".

الخلاصة

سواء كنت مطورًا، باحثًا، أو حتى شركة ناشئة، هذا النموذج هو أحد أهم المحطات لمستقبل التفاعل الصوتي التلقائي.

مېتا تطلق LLaMA 4: نموذج صوتي متعدد الوسائط يتحدى رواد الذكاء الاصطناعي

في قلب التطور: ما الجديد في LLaMA 4؟