Kaldi之父DanielPovey博士:发布k2核心代码
2022-07-23 23:32:13 来源:
11月15日,第五届Kaldi技术交流会在北京举办。Kaldi之父Daniel Povey博士首次亲临现场,与来自北京各大互联网公司、知名高校的开发者们深入交流下一代Kaldi社区未来的发展。
加入小米一年,Daniel Povey设计并开发出了新一代Kaldi。新一代Kaldi分成三个部分,包括核心算法部分,训练数据准备部分、示例脚本集合部分。
其中,Lhotse(训练数据准备部分)将替代以前Kaldi中所有数据准备相关的工作,操作各种音频和文本的元数据。Lhotse除了Kaldi本身,也适用于其他应用。而且Lhotse纯Python代码,方便易用。
Icefall(示例脚本集合部分)将代替Kaldi中的示例脚本集合,并独立成为一个单独的子项目。之所以要把示例脚本集合与核心算法分开,是考虑到示例脚本可能会非常庞大,且经常变动。
据介绍,新一代Kaldi的核心部分叫“k2”。k2可以让开发者很容易在PyTorch/TensorFlow中实现各种语音识别相关算法,比如CTC、LF—MMI、RNN—T、2nd—pass语言模型等,消除以往语音识别算法中训练跟解码不匹配的问题。
同时,通过k2可以非常容易实现(置信度逐渐提高的)多轮解码过程,这在以往是很难做到的。相较于其他一些语音识别库的优势,k2速度更快,通用性强(可以用来建模多种语音识别算法)。
Daniel Povey博士透露,k2核心代码已完成。约41000行代码(主要是C++),本周刚发布0。1版本。
资料显示,Daniel Povey博士目前担任小米集团语音首席科学家,由他开发和维护Kaldi 集成了多种语音识别模型,公认是业界语音识别框架的基石。
庆祝申遗成功周年泉州世界遗产将登上国家纪念币
2021年7月25日,泉州:宋元中国的世界海洋商贸中心列入《世界遗产名录》。今年7月25日,中国人民银行将发行世界遗产(泉州:宋元中国的世
2022-07-23 22:30
清华大一Python作业太难上热榜:只上3节课,手撸AI算法
太难了!太难了! 清华电子系,只学3节Python 课,然后…… 然后…… 就直接要求手撸一个AI算法! 就这样,清华再一次
2022-07-23 21:14
数字赋能全生命周期减碳施耐德电气2022年创新峰会开幕在即
(原标题:数字赋能全生命周期减碳 施耐德电气2022年创新峰会开幕在即) 当前,气候变化仍在加剧,加速减碳、实现可持续发展已成为
2022-07-23 16:42
施耐德电气王洁:双碳时代运行逻辑已变,企业亟需打造可持续影响
(原标题:施耐德电气王洁:双碳时代运行逻辑已变,企业亟需打造可持续影响力) 自双碳目标提出之后,减碳已逐渐成为社会各界的发展
2022-07-23 15:39
树榜样斩获佳绩-百度福建邵剑楠顺利通过2018年智学院培训
(原标题:树榜样斩获佳绩-百度福建邵剑楠顺利通过2018年百度云智学院培训) 强信念全力以赴,树榜样斩获佳绩 --百度福建营销中心技
2022-07-23 06:21
顶象发布《验证码“适老化”白皮书》助力数字金融适老化
(原标题:顶象发布《验证码适老化白皮书》助力数字金融适老化) 验证码作为人机交互界面经常出现的关键要素,是身份核验、防范风险
2022-07-23 05:20