百度新算法可准确识别英语不同口音

2024-04-22 20:43发布

百度研究院近日公布了其硅谷人智能实验室(SVAIL)的最新研究成果,其中包括能够准确识别英语和普通话的机器学习算法。 将该算法应用到百度深度学习系统中后,系统可以通过神经网络代替人系统进行语音识别英语口语识别,实现端到端的语音识别解决方案。 关于这项技术的论文最近已正式发布。

SVAIL成立于2013年。百度正在尝试探索像人一样学习的计算机系统。 通过在硅谷建立实验室学英语,百度可以吸引顶尖人才和创意程师来寻找各种创新。 (删除类似谷歌眼镜的创新)

百度此次公布的深度语音识别技术,依托的是近几年才广为人知的深度学习技术。 这是一门新兴的计算机科学,主要利用硬件和软件来人脑。 SVAIL的深度学习系统于去年首次推出。 其初衷是为了提高嘈杂环境下(如餐厅、汽和公共交通等)英语语音识别的准确性。 SVAIL研究人员在过去的一年里致力于提高深度语音识别中英语的识别性能,同时也继续训练其普通话文本转换能力。 普通话语音识别已经可以在多种场景下进行准确识别百度新算法可准确识别英语不同口音,并且很快将在网络搜索和移动设备等实际应用中大规模部署。

英语口语识别_口语识别app_口语识别英语怎么说

SVAIL基于深度学习系统的深度语音识别在识别各种英语口音方面取得了快速进展。 现在它可以准确识别印度英语和欧洲非英语国家的英语口音。 卡内基梅隆大学程设计助理研究教授 Ian Lane 表示:“去年,我有幸首次接触到仍处于起步阶段的深度语音识别,并对它的潜力有了一定的了解。现在短短一年的时间英语口语识别英语培训学英语,深度语音识别已经在使用端到端系统处理英语和普通话方面取得了长足的进步,即将进入实用阶段,百度批量调度器是一个非常高效的应用。它有能力改变大型深度神经网络在云 GPU 上的部署方式,我很期待它在这方面的表现。”

在网上发表的一篇题​​为《深度语音识别2:英语和普通话的端到端语音识别》的论文中,SVAIL的研究人员表示,深度语音识别正在学习处理世界各地不同口音的英语。 然而英语口语识别,目前这种处理很难应用于移动设备中常用的语音识别系统。

百度首席科学家吴恩达表示:“SVAIL已经证明我们的端到端深度学习方法可以识别多种不同的语言。我们方法的关键是使用高性能计算技术英语口语识别,这提高了测试速度与去年同期相比,提高了 7%。有了这样的效率,曾经需要数周时间的实验现在可以更快地重复。”

NVIDIA首席科学家Bill Dally博士在谈到深度语音识别的高性能算法时表示:“百度深度语音识别系统通过批量调度的方式在GPU上部署DNN进行语音识别。它的效率给我留下了深刻的印象。深度语音识别”语音识别 语音识别系统在 16 个 GPU 的集群上的 RNN 训练效果也非常抢眼。