ميزة التخزين المؤقت التلقائي تصل إلى Gemini 2.5 لتقليل التكاليف
أعلنت شركة Google عن دعم ميزة “التخزين المؤقت التلقائي” في نماذج Gemini 2.5، لتقليل تكاليف الطلبات المتكررة دون الحاجة لتخزين يدوي مسبق.

تفاصيل الخبر
في 8 مايو 2025، أعلن “لوغان كيلباتريك”، مدير المنتج في Google AI، عن إطلاق ميزة التخزين المؤقت التلقائي (Implicit Caching) لنماذج Gemini 2.5 عبر واجهة Gemini API. تأتي هذه الخطوة بعد نجاح ميزة التخزين المؤقت اليدوي التي طُرحت في مايو 2024.
- تتيح الميزة الجديدة تحقيق خصم تلقائي بنسبة 75% على الرموز (tokens) المكررة في الطلبات السابقة.
- لا حاجة لإنشاء “كاش” يدوي؛ فإذا كان الطلب الجديد يحتوي على مقدمة متطابقة مع طلب سابق، يُحتسب تلقائيًا كـ “ضربة كاش”.
- تقدم Google هذه الخصومات للمطورين بشكل مباشر، مما يخفض التكاليف دون تغيير في طريقة العمل.
- لتحقيق أقصى استفادة، يُنصح بإبقاء الجزء الثابت من الطلب في البداية، وإضافة المتغيرات مثل سؤال المستخدم في النهاية.
- تم تقليل الحد الأدنى لحجم الطلب ليكون أكثر قابلية لتفعيل الكاش:
- نموذج 2.5 Flash: من 2048 إلى 1024 توكن
- نموذج 2.5 Pro: من 4096 إلى 2048 توكن
- يظهر الآن حقل جديد cached_content_token_count في بيانات الاستخدام لتحديد عدد الرموز المخزّنة التي ستُخصم بسعر أقل.
- يمكن للمطورين الراغبين في ضمان التوفير الاستمرار باستخدام واجهة التخزين اليدوي أيضًا.
الأهداف المستقبلية
قبل أن تنطلق الميزة على نطاق أوسع، تهدف Google إلى:
- توسيع نطاق التوافق مع المزيد من واجهات Gemini والنماذج المستقبلية.
- تحسين الكشف التلقائي عن التكرار حتى مع اختلافات طفيفة في المقدمة.
- زيادة مرونة سياسة الخصم بما يتوافق مع سيناريوهات الذكاء الاصطناعي التفاعلي.
- دعم حالات الاستخدام التي تتطلب كفاءة عالية في التكلفة مثل المساعدات الرقمية، التعليم، وخدمات الدعم الآلي.
التخزين المؤقت التلقائي في Gemini 2.5 يمثّل نقلة نوعية لتقليل تكاليف التشغيل للمطورين، مع الحفاظ على الأداء والمرونة في بناء تطبيقات ذكاء اصطناعي متقدمة.