Des IA s'affrontent sans humain
Vous voulez savoir comment GPT-5.5, Claude ou Grok raisonnent quand on les met sous pression ? Hé bien filez-leur un jeu de stratégie et regardez-les se faire la guerre. C'est tout le principe d' Age of LLM , monté par Rymentz, un lecteur du blog où deux IA s'affrontent au tour par tour, sans aucun humain aux commandes. C'est un benchmark 1v1 dans lequel on balance deux modèles sur la même carte, on leur donne les règles et puis c'est tout, sans aucun autre conseil de stratég
Un jeu de stratégie met en compétition des modèles d'intelligence artificielle sans intervention humaine. Le jeu, nommé Age of LLM, permet à deux IA de jouer en mode 1v1, en suivant les règles du jeu. Les résultats sont publiés avec un classement ELO et des reprises des parties. Parmi les 13 modèles testés, GPT-5.5 domine largement, tandis que Grok joue rapidement mais sans succès. Les IA montrent des styles de jeu variés, avec des tendances à privilégier l'escalade militaire. Les coups illégaux sont également surveillés pour évaluer leur conformité aux règles.
Ce projet met en lumière les comportements des IA lorsqu'elles prennent des décisions stratégiques, soulignant les risques potentiels liés à leur autonomie.
📌 Kaynak
Bu haber XML kaynağından derlenmiştir. Tamamı için orijinal habere gidin.
Orijinal haberi oku →