C-Eval

C-Eval是一个适用于大语言模型的多层次多学科中文评估套件,由上海交通大学、清华大学和爱丁堡大学研究人员在2023年5月份联合推出,包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,用以评测大模型中文理解能力。
本站仅推荐AI工具,并不提供相关售前售后服务,请自行甄别服务,避免上当受骗。

C-Eval是什么

C-Eval是适用于大语言模型的多层次多学科中文评估套件,由上海交通大学、清华大学和爱丁堡大学研究人员在2023年5月份联合推出,包含13948个多项选择题,涵盖52个不同的学科和四个难度级别,用在评测大模型中文理解能力。通过零样本(zero-shot)和少样本(few-shot)测试,C-Eval 能评估模型在未见过的任务上的适应性和泛化能力。

C-Eval的主要功能

  • 多学科覆盖:C-Eval 包含 52 个不同学科的题目,涵盖 STEM、社会科学、人文科学等多个领域,全面评估语言模型的知识储备。
  • 多层次难度分级:设有四个难度级别,从基础到高级,细致评估模型在不同难度下的推理和泛化能力。
  • 量化评估与标准化测试:包含 13948 个多项选择题,通过标准化评分系统提供量化性能指标,支持不同模型的横向对比。

如何使用C-Eval

  • 数据下载
51工具网
51Tool专注于搜集与推荐全球范围内热门、创新、实用且前沿的AI工具与资讯。我们的使命是打造一个高效、可靠的人工智能门户,让每一位用户都能轻松探索AI世界,助力您在个人发展、学业进步与职业工作中,充分释放人工智能的潜能
© 51工具网 2025 All Rights Reserved. Powered by DouPHP 闽ICP备14017858号-7