51工具网51工具网
  • 首页
  • 每日AI资讯
  • AI免费教程
  • 关于我们
登录
提交AI工具
  • AI智能助手
  • AI写作创作
  • AI图像
    AI图片插画生成 AI图片背景移除 AI图片物体抹除 AI图片无损放大 AI图片优化修复 AI商品图生成 AI 3D模型生成 常用AI图像工具
  • AI视频
  • AI办公
    AI幻灯片和演示 AI表格数据处理 AI思维导图 AI文档工具 AI会议工具 AI招聘求职 AI法律助手 AI语言翻译 AI效率提升
  • AI智能体
  • AI编程
  • AI设计
  • AI音频
  • AI搜索引擎
  • AI开发平台
  • AI学习
  • AI训练模型
  • AI模型评测
  • AI内容检测
  • AI提示词
AI模型评测
查看更多
MagicArena
字节推出的视觉生成模型对战平台
直达
MMLU
大规模多任务语言理解基准
直达
Open LLM Leaderboard
Hugging Face推出的开源大模型排行榜单
直达
C-Eval
一个全面的中文基础模型评估套件
直达
FlagEval
智源研究院推出的FlagEval(天秤)大模型评测平台
直达
AI Ping
AI大模型服务性能评测平台
直达
SuperCLUE
中文通用大模型综合性测评基准
直达
AGI-Eval
AI大模型评测社区
直达
OpenCompass
上海人工智能实验室推出的大模型开放评测体系
直达
CMMLU
一个综合性的大模型中文评估基准
直达
MMBench
全方位的多模态大模型能力评测体系
直达
HELM
斯坦福大学推出的大模型评测体系
直达
LMArena
AI模型评估平台
直达
LLMEval3
由复旦大学NLP实验室推出的大模型评测基准
直达
H2O EvalGPT
H2O.ai推出的基于Elo评级方法的大模型评估系统
直达
PubMedQA
生物医学研究问答数据集和模型得分排行榜
直达
  • 1
© 51工具网 2025 All Rights Reserved. 闽ICP备14017858号-7
每日AI资讯 AI免费教程 关于我们