搜索

用于大模子的首批中文根基语料库宣告

发表于 2024-10-18 00:28:03 来源:饕餮之徒网

  中新网北京12月21日电 中国网络空间牢靠协会家养智能牢靠打点业余委员会20日在北京召开宣告会,用于面向社会宣告用于大模子的大模的首首批中文根基语料库。

  据悉,批中网安协会家养智能牢靠打点专委会会同国家权威机构,文根发挥企业、基语高校以及科研单元协同劣势,料库经由“共建-同享”机制,宣告汇聚一批高品质可信数据,用于经由去重、大模的首过滤等技术伎俩,批中组成并对于社会宣告首批120G中文根基语料,文根包罗1亿余条数据,基语500亿个token。料库用户登录中国网络空间牢靠协会网站,宣告点击“中文根基语料库”链接,用于经由注册、认证等挨次,就能下载相干语料。

  网安协会家养智能牢靠打点专委会负责人呈现,语料库建树是一项临时性、业余性的使命,需要凭证响应规定、规范以及规范,需要协力共建、突破立异,增长组成迷信实用的语料库汇聚、解决、运用机制,为国家家养智能技术立异以及工业发展赋能。

  来自专委会成员单元、大模子存案机谈判相干畛域科研、企业、社会机关代表近100人退出宣告会。

随机为您推荐
友情链接
版权声明:本站资源均来自互联网,如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

Copyright © 2016 Powered by 用于大模子的首批中文根基语料库宣告,饕餮之徒网   sitemap

回顶部