En construction
Benchmark EmoBench
Examiner la cohérence de ton, la stabilité émotionnelle et la qualité d'interprétation dans des échanges simulés.
Comparaison
Des protocoles d'évaluation conçus pour comparer des modèles, des comportements et des réponses sur des critères explicites.
Examiner la cohérence de ton, la stabilité émotionnelle et la qualité d'interprétation dans des échanges simulés.
Comparer plusieurs LLM sur la précision, la structure de réponse et les compromis entre coût, vitesse et fiabilité.