语言资源与智能技术子实验室重点以国家发展战略为指引,围绕“资源建设、技术突破、应用服务”为主线,点关注汉语通用语以及低资源语言资源体系建设和智能化分析处理等难题,推动语言资源体系建设与中文信息处理技术的融合创新,打造具有示范效应的语言智能创新应用平台,服务国家语言文字事业现代化进程。
语言资源与智能技术子实验室研究团队,主要依托应用语言学研究室和辞书编纂研究中心,主体成员也从属于院“登峰计划”语料库语言学特殊学科。团队现有正研究员3位、副研究员3位、助理研究员4位,覆盖语言学、民族语言学、计算语言学、人工智能、词典学等多个领域。
语言资源与智能技术子实验室研究方向包括:(1)国家语料库建设平台,旨在构建规模大、结构平衡、标注丰富、动态更新、用途广泛、开放共享的汉语语言资源体系,集成高效用例检索、频次统计、搭配查询、用法对比、字词画像等语言分析功能,为语言教学与研究提供强有力的基础设施;(2)汉语低资源信息处理工具,聚焦于汉语低资源语言的信息化处理现阶段重点集中于古代语言、民族语言等资源平台和信息处理工具构建两方面;(3)语文辞书智能编纂平台,面向数智时代辞书编纂需求,融合大语言模型生成能力,支持对大规模语料库、权威辞书库及在线数字资源的广泛检索,辅助《新华字典》《现代汉语词典》等权威辞书的编纂工作。
语言资源与智能技术子实验室科研人员合影