国产中文大语言模型“天河天元”发布:由天河超算训练

天河天元大模型涵盖小说、古文、百科、新闻、中医、法律等数据集,训练数据集总token数达到350B。天河E级智能计算开放创新平台,将带来突破百亿亿次的跨模态的超级计算算力。
支撑传统的科学工程计算,并服务智能混合计算,打造全方位的算力赋能创新和数字经济高质量发展载体。中文大语言模型的数据集非常稀缺。国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据,以及专业领域的中医、医药、问诊、法律等多种数据集。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索
本网站由提供CDN加速/云存储服务