阿里开源大模型治理中文数据集

智东西消息,阿里巴巴天猫精灵和通义大模型团队联合提出了面向中文大模型的价值观评估基准CVALUES,以衡量大语言模型在安全和责任标准方面的对齐能力。该团队共评测了十多个大模型,研究结果表明,虽然大多数中国大模型在安全性方面表现良好,但在责任方面仍有相当大的改进空间。
此外,该团队推出了大语言模型治理开源中文数据集100PoisonMpts 。据称,该项目提供了业内首个大语言模型治理开源中文数据集,十多位知名专家学者成为了首批AI标注工程师。标注人各提出100个诱导偏见、歧视回答的刁钻问题,并对大模型的回答进行标注。
论文链接:
http://xdp-expriment.oss-cn-zhangjiakou.aliyuncs.com/shanqi.xgh/release_github/CValues.pdf
项目地址:
https://github.com/X-PLUG/CValues
魔搭地址:
https://modelscope.cn/datasets/damo/100PoisonMpts/summary

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索
本网站由提供CDN加速/云存储服务