أخبار

آبل: “لا دليل على التفكير الرسمي” في نماذج اللغات الكبيرة

14/10/202414/10/2024

قام باحثو آبل بنشر دراسة جديدة تكشف عن قيود كبيرة في قدرات التفكير لدى نماذج اللغات الكبيرة (LLMs)، بما في ذلك تلك من المختبرات الرائدة مثل نماذج OpenAI 4o و o1.

تفاصيل الخبر

طور علماء آبل معيارًا جديدًا يُسمى GSM-Symbolic لتقييم مهارات التفكير الرياضي لنماذج اللغات الكبيرة. وجدت الدراسة أن التغييرات البسيطة في صياغة الأسئلة أو إضافة معلومات غير ذات صلة قد تغير مخرجات النموذج بشكل كبير، مما أدى إلى انخفاض الدقة بنسبة تصل إلى 65٪. كما لاحظ الباحثون زيادة في تباين الأداء وانخفاض الدقة مع زيادة تعقيد الأسئلة. استنتج الفريق أنه لا يوجد دليل على التفكير الرسمي في النماذج التي تم اختبارها، مما يشير إلى أن السلوك هو أكثر احتمالية لمطابقة النمط الذكي.

الأهداف المستقبلية

في حين أن هناك آراء متباينة حول ما إذا كانت نماذج اللغات الكبيرة يمكن أن تفكر حقًا، تصنف هذه الدراسة الجديدة في فئة الـ “لا”. إذا كانت هذه القيود صحيحة، فإنها تثير بعض الأسئلة الكبيرة حول موثوقية ومخاطر نشر هذه النماذج في تطبيقات تزداد تعقيدًا.

أخبار

جوجل توسع AI Mode وتضيف ميزات ذكية جديدة للبحث

24/08/202524/08/2025

أعلنت Google عن توسيع ميزة AI Mode في محرك البحث لتشمل أكثر من 180 دولة، مع…

أخبار

سامسونج تكشف رسميًا عن سلسلة Galaxy Tab S10 مع تغييرات كبيرة

29/09/202429/09/2024

أعلنت شركة سامسونج رسميًا عن إطلاق سلسلة Galaxy Tab S10 الجديدة، التي تتميز بتقنيات متقدمة وتصميم…

أخبار

معركة قانونية بين ARM و Qualcomm تهدد بإنهاء تراخيص تكنولوجيا ARM

28/10/202428/10/2024

في تطور مثير للصناعة التكنولوجية، دخلت شركتا ARM و Qualcomm في معركة قانونية قد تهدد بإنهاء تراخيص تكنولوجيا ARM لشركة Qualcomm. هذه القضية لها تأثيرات كبيرة على قطاع تكنولوجيا الهواتف المحمولة والأجهزة الذكية. تفاصيل الخبر تعزيز الثقة وتوسيع التعاون