AI benchmarks are broken. Here’s what we need instead.

🤖 Yapay Zekâ 📰 MIT 🕐 31.03.2026

Yapay zeka modellerini değerlendirmek için kullanılan kıyas sistemleri yetersiz kalmıştır. İnsan-AI karşılaştırması yerine daha kapsamlı değerlendirme yöntemlerine gereksinim duyulmaktadır.

For many years, artificial intelligence has been assessed by comparing its performance against human capabilities in specific tasks. This evaluation method has been applied across various domains, including games like chess, complex mathematical problems, software development, and even creative writing. The approach of pitting AI directly against human performance on isolated tasks has been a long-standing and appealing way to measure AI progress.

This benchmark approach is being questioned as potentially inadequate for understanding the true capabilities and limitations of modern AI systems.

#yapay zeka

📌 Kaynak

Bu özet MIT kaynağından otomatik derlenmiştir. Tamamı için orijinal habere gidin.

Orijinal haberi oku →
📱
News AI World — Mobil uygulama
Bu haberleri 45 dilde, anlık çeviriyle cebinde. Erken erişim için Gmail adresini bırak.
← Tüm haberlere dön