أخبار

LLM-D يحل أزمة اختناقات استدلال الذكاء الاصطناعي

05/01/202604/01/2026

مع توسّع استخدام النماذج اللغوية الكبيرة داخل الشركات، لم يعد التحدي في دقة النموذج بل في تشغيله بكفاءة. وهنا يبرز LLM-D كحل بنيوي ذكي لمعالجة ازدحام الاستدلال وتكاليفه.

تفاصيل الخبر

يركّز طرح LLM-D على معالجة مشكلة أساسية تواجه المؤسسات عند تشغيل النماذج اللغوية على نطاق واسع، وهي فوضى حركة طلبات الاستدلال وعدم تساويها.

قدّم سيدريك كليبورن، كبير دعاة المطورين في Red Hat، شرحًا لحل مفتوح المصدر يُدعى LLM-D (Large Language Model – Distributed).
يعتمد الحل على التوجيه الذكي للطلبات بدل التوزيع العشوائي أو الدائري التقليدي.
يقيّم النظام كل طلب وفق الحمل الحالي، وزمن الاستجابة المتوقع، وإمكانية الاستفادة من التخزين المؤقت.
يعمل LLM-D كبوابة استدلال تشبه برج مراقبة الحركة الجوية، حيث يوجّه كل طلب إلى المورد الأنسب له.
يفصل عملية الاستدلال إلى مرحلتين مستقلتين:
- مرحلة Pre-fill كثيفة الذاكرة.
- مرحلة Decode تسلسلية وقابلة للتوسّع الأفقي.
يتيح هذا الفصل استخدام العتاد بكفاءة أعلى ومشاركة ذاكرة KV cache بين الطلبات المتشابهة.
أظهرت النتائج تحسنًا ملحوظًا، منها خفض زمن P90 ثلاث مرات وتسريع زمن أول رمز حتى 57 مرة.

الأهداف المستقبلية

يُتوقع أن يلعب LLM-D دورًا محوريًا في بنية الذكاء الاصطناعي المؤسسية:

تمكين تشغيل النماذج اللغوية على نطاق واسع بتكلفة أقل.
تحسين الالتزام باتفاقيات مستوى الخدمة (SLO وQoS).
زيادة كفاءة استهلاك وحدات GPU في البيئات الإنتاجية.
دعم الانتقال من النماذج التجريبية إلى خدمات ذكاء اصطناعي موثوقة.

الخاتمة:
يمثل LLM-D تحولًا في طريقة التفكير ببنية تشغيل النماذج اللغوية، حيث ينتقل التركيز من مجرد تشغيل النموذج إلى تشغيله بكفاءة واستدامة في ظروف العالم الحقيقي.

أخبار

Honeycomb.io تنظم Observability Day SF 2025

03/09/202502/09/2025

تنظم Honeycomb.io فعالية مميزة بعنوان “ما التالي؟ مستقبل الرصد في عصر الذكاء الاصطناعي”، لتجمع الخبراء والمهندسين…

أخبار

xAI تقدم Grok للحكومة الأمريكية بسعر 0.42 دولار لكل وكالة

28/09/202527/09/2025

xAI وقعت اتفاقًا جديدًا مع إدارة الخدمات العامة الأميركية (GSA) لتوفير نماذج Grok المتقدمة لوكالات الحكومة…

أخبار

Anthropic تطلق وضع الصوت في Claude لتجربة تفاعلية طبيعية

28/05/202528/05/2025

أعلنت شركة Anthropic عن إطلاق ميزة “وضع الصوت” في تطبيقها Claude، لتمنح كافة المستخدمين, تجربة محادثة…

أخبار

شراكة بين NFL ومايكروسوفت لدمج Copilot بالملاعب والإدارة

23/08/202521/08/2025

أعلنت رابطة الدوري الوطني لكرة القدم الأمريكية NFL ومايكروسوفت عن تمديد شراكة استراتيجية متعددة السنوات، لتوسيع…

أخبار

استقال الرئيس التنفيذي لـ GitHub وانضم لقسم CoreAI بمايكروسوفت

13/08/202512/08/2025

أعلن توماس دومك، الرئيس التنفيذي لشركة GitHub، عن مغادرته بعد نحو أربع سنوات لبدء شركته الناشئة،…

أخبار

قمة مستقبل البلوك تشين 2024: دبي تتصدر الابتكار الرقمي

09/10/202409/10/2024

تُواصل دبي مسيرتها في قيادة الابتكار والتكنولوجيا المتقدمة من خلال تنظيم قمة مستقبل البلوك تشين 2024، التي جمعت نخبة من الخبراء والمتخصصين من مختلف أنحاء العالم لمناقشة مستقبل هذه التكنولوجيا الواعدة. تفاصيل الخبر انطلقت قمة مستقبل البلوك تشين 2024 اليوم في دبي، حيث اجتمع الحضور من كافة أنحاء العالم لمناقشة أحدث الابتكارات والتطبيقات في تكنولوجيا البلوك تشين. تميزت القمة بمشاركة عدد من الخبراء وصناع القرار في المجال، وتبادل الأفكار والرؤى حول كيفية استخدام البلوك تشين لتحقيق التطور الاقتصادي والتكنولوجي المستدام. من التقنيات المبتكرة التي تم مناقشتها في قمة مستقبل البلوك تشين 2024: الاهداف المستقبلية تهدف القمة إلى تعزيز التعاون بين القطاعين العام والخاص وتطوير الشراكات الاستراتيجية التي تساهم في تحويل دبي إلى مركز عالمي للبلوك تشين. كما تسعى القمة إلى استكشاف الفرص المستقبلية واستخدام البلوك تشين في مختلف القطاعات الاقتصادية، مما يعزز من مكانة دبي كمدينة ذكية ورائدة في الابتكار الرقمي.

تفاصيل الخبر

الأهداف المستقبلية

مقالات مشابهة