51工具网
首页
每日AI资讯
AI免费教程
关于我们
登录
提交AI工具
AI智能助手
AI写作创作
AI图像
AI图片插画生成
AI图片背景移除
AI图片物体抹除
AI图片无损放大
AI图片优化修复
AI商品图生成
AI 3D模型生成
常用AI图像工具
AI视频
AI办公
AI幻灯片和演示
AI表格数据处理
AI思维导图
AI文档工具
AI会议工具
AI招聘求职
AI法律助手
AI语言翻译
AI效率提升
AI智能体
AI编程
AI设计
AI音频
AI搜索引擎
AI开发平台
AI学习
AI训练模型
AI模型评测
AI内容检测
AI提示词
AI模型评测
查看更多
MagicArena
字节推出的视觉生成模型对战平台
直达
MMLU
大规模多任务语言理解基准
直达
Open LLM Leaderboard
Hugging Face推出的开源大模型排行榜单
直达
C-Eval
一个全面的中文基础模型评估套件
直达
FlagEval
智源研究院推出的FlagEval(天秤)大模型评测平台
直达
AI Ping
AI大模型服务性能评测平台
直达
SuperCLUE
中文通用大模型综合性测评基准
直达
AGI-Eval
AI大模型评测社区
直达
OpenCompass
上海人工智能实验室推出的大模型开放评测体系
直达
CMMLU
一个综合性的大模型中文评估基准
直达
MMBench
全方位的多模态大模型能力评测体系
直达
HELM
斯坦福大学推出的大模型评测体系
直达
LMArena
AI模型评估平台
直达
LLMEval3
由复旦大学NLP实验室推出的大模型评测基准
直达
H2O EvalGPT
H2O.ai推出的基于Elo评级方法的大模型评估系统
直达
PubMedQA
生物医学研究问答数据集和模型得分排行榜
直达
1