الأحد، 14 ديسمبر 2025

دراسة: أفضل نماذج الذكاء الاصطناعي لا تتجاوز دقتها 69%

دراسة: أفضل نماذج الذكاء الاصطناعي لا تتجاوز دقتها 69%

دراسة: أفضل نماذج الذكاء الاصطناعي لا تتجاوز دقتها 69%

كشفت شركة غوغل ديب مايند، التابعة لغوغل، عن معايير جديدة لقياس موثوقية نماذج الذكاء الاصطناعي، حملت اسم FACTS Benchmark Suite، وتهدف إلى اختبار قدرة هذه النماذج على تقديم إجابات دقيقة وموثوقة من حيث الحقائق.


وتقيس هذه المعايير أداء النماذج في أربعة مجالات رئيسية، تشمل الإجابة عن الأسئلة اعتمادًا على المعرفة الداخلية، والاستخدام الفعّال للبحث عبر الإنترنت، ودعم الإجابات بوثائق طويلة، إضافة إلى تفسير الصور بدقة.


وبحسب تقرير لموقع بيزنس إنسايدر، حقق أفضل نموذج خاض الاختبار، وهو جيميني 3 برو من غوغل، دقة بلغت 69% فقط، في حين جاءت دقة النماذج الرائدة الأخرى أقل من ذلك، ما يثير تساؤلات حول مدى الاعتماد على الذكاء الاصطناعي في المهام الحساسة.


ويحمل هذا الرقم دلالة مهمة للشركات والمؤسسات التي تراهن بقوة على الذكاء الاصطناعي، إذ تُظهر النتائج أن النماذج، رغم سرعتها وطلاقتها، لا تزال بعيدة عن مستوى الدقة البشرية، خاصة في المجالات التي تتطلب معرفة متخصصة أو تحليلًا معقدًا.


وتبرز خطورة هذه الأخطاء في قطاعات مثل الصحة والمال والقانون، حيث قد يؤدي خطأ بسيط في معلومة إلى عواقب جسيمة، كما حدث في إحدى القضايا الشهيرة عندما تسبب استخدام محتوى وهمي أنشأه الذكاء الاصطناعي في فصل موظف.


ورغم أن معايير FACTS تمثل تحذيرًا واضحًا، فإنها تُعد أيضًا خارطة طريق لتحسين النماذج مستقبلًا. لكن حتى ذلك الحين، تبقى الحقيقة الثابتة أن الذكاء الاصطناعي يتحسن باستمرار، إلا أنه لا يزال يخطئ في نحو ثلث الحالات.

 

ليست هناك تعليقات:

إرسال تعليق