摘要:今天,教育部召开新闻发布会,介绍推进语言文字信息化发展情况。教育部语言文字信息管理司司长刘培俊提到,支持有关高校联合人工智能及信息服务领域头部企业,研发语言翻译、智能语音、大语言模型等产品。
中国青年报客户端北京3月31日电(中青报·中青网记者 杨洁)今天,教育部召开新闻发布会,介绍推进语言文字信息化发展情况。教育部语言文字信息管理司司长刘培俊提到,支持有关高校联合人工智能及信息服务领域头部企业,研发语言翻译、智能语音、大语言模型等产品。
教育部召开新闻发布会。中青报·中青网记者 杨洁/摄
刘培俊介绍,在语言科技数字化赋能产业升级,有力服务经济社会发展方面,发布汉字简繁文本智能转换系统,大语言模型评测技术等百余项科研成果。广布局设置科研机构。设立中国语言智能研究中心、多语种信息技术研究中心、语言技术与数字经济研究中心等,形成语言科技研发方阵。
此外,教育部会同有关部门推动研制并发布了《信息技术 中文编码字符集》等国家通用语言文字和民族语言文字信息化规范标准100多项,为自然语言处理技术在人工智能、数字产品和信息产业领域的应用创新奠定规范基础。
“当前,语言文字作为教育资源、科技资源、文化资源、经济资源、安全资源和战略资源,它的功能作用更加突出。”刘培俊强调,语言文字服务经济社会发展,数据要素价值更加彰显,语言文字事业的基础性、全局性、社会性、全民性特点更加鲜明。
刘培俊介绍,清华大学、北京大学、哈尔滨工业大学等开展了语言文字信息技术的深度研发,促进中文信息互联互通。其中,北京大学王选计算机研究所建成了中华精品字库。大规模构建语言资源体系。建成了世界最大规模语言资源库和中国语言资源知识图谱,多模态集成120多种语言和方言资源。大领域布局大语言模型技术应用,聚焦关键领域的需求,试点建设了一批自主安全可控的大语言模型。其中,北京师范大学古汉语大语言模型等已上线。
此外,党的十八大以来,教育部推动语言文字信息化服务取得新成效。刘培俊介绍,高水平开展普通话水平测试,全面实现从人工到智能的普通话测试方式转变,制发电子证书9000多万份。
为多领域推动语言文化资源共建共享,刘培俊介绍,教育部建成国家语委媒体语言语料库、冬奥会多语言术语库、公共服务领域译写规范术语库、规范标准课程库等30多项,多渠道打造示范平台。上线国家语言资源服务平台、中国语言文字数字博物馆、中国语言资源博物馆数字展区等。指导各地各校开展云端学习等课程平台。
“数字赋能让收藏在博物馆的文物活起来,支持联合开展古文字数字化研究,开通甲骨文数据平台,传承中华优秀传统文化根脉。”刘培俊介绍,目前建成中华思想文化术语数据库,面向国际传播1200多条反映中华民族话语体系中最核心最本质的思想文化术语,并与40多个国家和地区开展多语种数字版权合作。此外,已建成集成化、智能化、国际化的全球中文学习平台,用户超1600万人,覆盖190多个国家和地区,深度化合作建立联盟,中文学习联盟云服务平台提供3万门在线课程,与中外1600多家机构合作,推动实现中文人人、时时、处处可学可用、易学易用。
来源:中国青年报