xSegmenter 旨在解决语音语料库建设过程中的音段标注效率和一致性问题 ,该工具基于用户所提供的语料及相关资源训练生成单音素声学模型 , 然后进行音段强制对齐和标注 , 最后针对每个声音文件转写生成相应的语音标注文件 ,可包括词语层、音节层和音素层等标注内容。
作者:熊子瑜
主要特色:
由于该工具自身不提供任何声学模型和词典 ,而是基于用户所提供的声音文件 、 带有分词信息的发音文本文件和发音词典文件等数据资源自动训练生成相应的语音声学模型 , 然后再利用所生成的语音声学模型去完成音段对齐任务 ,因此这一工具可适用于任意语言和方言的语音库建设。
物料: 声音文件 + 发音文本文件 + 发音词典
过程: 训练 + 切分 + 标注
结果:TextGrid 标注文件
链接:https://pan.cass.cn/disk/s/NfNkvvJRRPL?pwd=116805&domainId=bj17093
密码:116805