C-Eval

183次阅读

C-Eval

C-Eval官网

大语言模型的多层次多学科中文评估套件
网站服务：C-Eval。

C-Eval 是一个全面的中文基础模型评估套件。它包含了13948个多项选择题，涵盖了52个不同的学科和四个难度级别，如下所示。通过 C-Eval 试题的测试后得到了一份中文大语言模型的排行榜，其中表现最好的是来自是由清华大学和智谱 AI 联合研发的第二代 GLM 系列对话语言模型，其次是GPT – 4模型。

C-Eval网址入口

https://cevalbenchmark.com/index_zh.html#home_zh

小编发现C-Eval网站非常受用户欢迎，请访问C-Eval网址入口试用。