51工具网
AI智能助手
AI写作创作
AI图像工具
AI图片插画生成
AI图片背景移除
AI图片物体抹除
AI图片无损放大
AI图片优化修复
AI商品图生成
AI 3D模型生成
常用AI图像工具
AI视频工具
AI办公工具
AI幻灯片和演示
AI表格数据处理
AI思维导图
AI文档工具
AI会议工具
AI招聘求职
AI法律助手
AI语言翻译
AI效率提升
AI智能体
AI编程工具
AI设计工具
AI音频工具
AI搜索引擎
AI开发平台
AI学习网站
AI训练模型
AI模型评测
AI内容检测
AI提示指令
51工具网
AI工具箱
AI智能助手
AI写作创作
AI图像工具
AI视频工具
AI办公工具
AI智能体
AI编程工具
AI设计工具
AI音频工具
AI搜索引擎
AI开发平台
AI学习网站
AI训练模型
AI模型评测
AI内容检测
AI提示指令
每日AI资讯
AI免费教程
关于我们
提交
AI模型评测
查看更多
MagicArena
字节推出的视觉生成模型对战平台
MMLU
大规模多任务语言理解基准
Open LLM Leaderboard
Hugging Face推出的开源大模型排行榜单
C-Eval
一个全面的中文基础模型评估套件
FlagEval
智源研究院推出的FlagEval(天秤)大模型评测平台
AI Ping
AI大模型服务性能评测平台
SuperCLUE
中文通用大模型综合性测评基准
AGI-Eval
AI大模型评测社区
OpenCompass
上海人工智能实验室推出的大模型开放评测体系
CMMLU
一个综合性的大模型中文评估基准
MMBench
全方位的多模态大模型能力评测体系
HELM
斯坦福大学推出的大模型评测体系
LMArena
AI模型评估平台
LLMEval3
由复旦大学NLP实验室推出的大模型评测基准
H2O EvalGPT
H2O.ai推出的基于Elo评级方法的大模型评估系统
PubMedQA
生物医学研究问答数据集和模型得分排行榜
1