中新网北京12月21日电 中国网络空间牢靠协会家养智能牢靠打点业余委员会20日在北京召开宣告会,用于面向社会宣告用于大模子的大模的首首批中文根基语料库。 据悉,批中网安协会家养智能牢靠打点专委会会同国家权威机构,文根发挥企业、基语高校以及科研单元协同劣势,料库经由“共建-同享”机制,宣告汇聚一批高品质可信数据,用于经由去重、大模的首过滤等技术伎俩,批中组成并对于社会宣告首批120G中文根基语料,文根包罗1亿余条数据,基语500亿个token。料库用户登录中国网络空间牢靠协会网站,宣告点击“中文根基语料库”链接,用于经由注册、认证等挨次,就能下载相干语料。 网安协会家养智能牢靠打点专委会负责人呈现,语料库建树是一项临时性、业余性的使命,需要凭证响应规定、规范以及规范,需要协力共建、突破立异,增长组成迷信实用的语料库汇聚、解决、运用机制,为国家家养智能技术立异以及工业发展赋能。 来自专委会成员单元、大模子存案机谈判相干畛域科研、企业、社会机关代表近100人退出宣告会。 |