教育部、国家语委已经支持布局五个领域的大语言模型建设项目
新京报讯(记者冯琪)“新型国家语料库”如何建设?3月31日,新京报从教育部召开的新闻发布会上获悉,教育部、国家语委已经支持布局了五个领域的自主安全可控大语言模型建设项目;教育部已经启动布局了新型国家语料库的建设,包括“中华文脉新型语料库”“中华大阅读体系语料库”等。
“当前以深度求索(DeepSeek)等为代表的人工智能技术创新不断取得突破性的进展,在这个大背景下,国家提出建设新型国家语料库的战略部署,凸显了其重要性、必要性和紧要性。”在3月31日的新闻发布会上,教育部语言文字应用管理司副司长王晖说道。
他指出,现在在一些应用领域,主要是在语言的教育教学和研究领域,有多个语料库,但是很多语料库还处于单一文本模式和领域应用阶段,在建设的理念、技术和方法、规模,以及数据多样性、时效性尤其是与人工智能相结合的大规模应用方面还存在不足,难以满足多元化、动态化尤其是智能化的语言数据需求。
“我们总的考虑是:立足人工智能时代大背景,突破传统语料库单一文本模式和领域应用壁垒,以大模型训练及性能评测、智能计算为核心,以新质态、多模态、多语言、大规模、全域性为突出特性,为通用领域和细分领域多场景应用及创新发展提供规范、可信、高质量的语言文化语料资源。”王晖说道。
记者注意到,《教育强国建设规划纲要》提出,要建设“新型国家语料库”,近日印发的《关于加强数字中文建设 推进语言文字信息化发展的意见》(下称《意见》)中提出,到2027年初步建成国家关键语料库和国家战略语言资源信息库等。
对此,3月31日的发布会上,教育部语言文字信息管理司司长刘培俊指出,将以建设语料基础设施为新基建,服务大语言模型以及生成式人工智能等技术前沿创新应用的制高点。
“目前,教育部、国家语委已经支持布局了五个领域的自主安全可控大语言模型建设项目,下一步将根据需求稳步扩大建设范围,提升建设成效。”刘培俊说道。
他进一步表示,接下来将夯实“机制、标准、人才”三个基础。第一是逐步建立健全语料共建共享新机制,第二是研制语言资源、语言数据、基础语料以及大语言模型的技术和管理标准,第三是依托高校研究机构推进多学科交叉融合,为语言科技、语料建设以及人工智能创新应用培养高素质人才。
王晖透露,2025年,教育部已经启动布局了新型国家语料库的建设工作,主要包括两方面:一是规范引领,加强制度的供给,研制语料库建设规范,为语料库建设提供基础原则和方法指引。二是示范引导,成熟先上,开发建设“中华文脉新型语料库”“中华大阅读体系语料库”,以这两个示范库建设整体打造出标杆。
他解释,“中华文脉新型语料库”也可以简单理解为瞄准的是智慧教师,“中华大阅读体系语料库”瞄准的是智慧学伴。“在此基础上,探索建设系列教育、语言文化国家新型语料库群,服务教育强国、文化强国建设。”
编辑 缪晨霞
校对
-
五大赛道150个项目精彩对决 2025金砖国家工业创新大赛决赛在厦举办
来源:台海网台海网9月13日讯 (海峡导报记者 黄奕琳)9月12日,2025金砖国家工业创新大赛决赛在厦门拉开帷幕,来自金砖国家及金砖伙伴国的创新项目现场进行路演答辩,展开精彩角逐。据了解,本届大赛以“释放大金砖合作潜力 实现包容可持续工业化”为主题,聚焦“创新金砖”“绿色金砖”建设,设置人工智能、2025-09-13 08:54:00 -
人工智能拓展服务消费新场景
日前,国务院印发了《关于深入实施“人工智能+”行动的意见》,将“人工智能+”消费提质作为一项重点行动进行部署,明确多项举措拓展服务消费新场景。近年来,服务消费作用愈加凸显。根据国家统计局发布的数据,2024年我国服务业增加值占国内生产总值比重为56.7%,对国民经济增长的贡献率达56.2%。然而,服2025-09-12 07:19:00 -
协同发展谱新篇丨雄安新区中关村科技园:当好京津冀产业协同“纽带”,激活区域发展新势能
冀时客户端报道 9月8日至9月10日,由中共河北省委网信办、中共北京市委网信办、中共天津市委网信办联合主办的“协同发展谱新篇”网络主题宣传活动正式启动。9月8日,记者走进雄安新区中关村科技园。园区位于雄安新区容东片区华望城南部地块,一期二期合计总面积约14万平方米。以人工智能、数字科技、生物技术、低2025-09-09 17:46:00 -
打虎!正部级易会满,被查
安徽商报2025-09-06 11:42:00中央纪委国家监委网站9月6日消息,十四届全国政协经济委员会副主任易会满涉嫌严重违纪违法,目前正接受中央纪委国家监委纪律审查和监察调查。图片来源:中央纪委国家监委网站 公开信息显示,易会满出生于1964年12月,高级管理人员工商管理硕士,中共党员。他是第二2025-09-07 00:09:00 -
墨香润社区:公益课堂点亮居民文化生活
“没想到社区能开设这么专业的书法课,让我们这些老年人老有所学,年轻人也能静心练字,这样的活动太有意义了!”9月2日上午,在金凤区长城中路街道凤仪社区开展的“笔墨飘香传雅韵 文化传承润心田”软笔书法公益课堂上,居民王学礼手持毛笔,看着自己笔下逐渐成形的“福”字,脸上满是喜悦。活动现场,社区特意邀请的书2025-09-05 12:26:00 -
山东推出中小学人工智能教育“十大行动”,力求未来3-5年实现五大突破
日前,山东省教育厅等6部门印发《中小学人工智能教育“十大行动”的实施意见》,聚焦基础教育阶段,对高质量推进人工智能教育作出系统部署。省教育厅有关负责人进行了解读。为何要专门推出中小学人工智能教育“十大行动”?省教育厅有关负责人表示,山东省推出中小学人工智能教育“十大行动”是应对人工智能时代教育变革的2025-09-04 12:06:00 -
【百家民企说】软通动力夏杰:未来企业或成为能自我进化的生命体
中新经纬8月29日电 (谢婧雯 常涛)“不再仅靠人的经验运营决策,而是一个能够自主感知、决策、执行并实现自我进化的生命体。”2025数博会期间,软通动力高级副总裁夏杰在接受中新经纬专访时,描绘了他对未来智慧企业形态的畅想。软通动力夏杰 受访者供图“数聚”是“智启”的基础公开资料显示,软通动力20052025-08-29 11:49:00 -
国家发展改革委:深入实施“人工智能+” 坚决避免无序竞争和一拥而上
北京商报讯(记者 金朝力 程靓)8月29日,国家发展改革委高技术司副司长张铠麟在新闻发布会上表示,围绕《关于深入实施“人工智能+”行动的意见》,国家发展改革委将进一步加大统筹,与各方一起共同努力,形成合力。在实施行动过程中,将推动各地立足区位特点、资源禀赋和产业基础,科学确定发展重点,形成各具特色、2025-08-29 11:32:00