Quantcast
Channel: InfoQ - 促进软件开发领域知识与创新的传播
Viewing all articles
Browse latest Browse all 1056

2019年,这8款自动语音识别方案你应该了解!

$
0
0

基于计算机的人类语音识别与处理能力,被统称为语音识别。目前,这项技术被广泛用于验证系统中的某些用户,以及面向谷歌智能助手、Siri或者Cortana等智能设备下达指令。

从本质上讲,我们通过存储人声与训练自动语音识别系统以发现语音当中的词汇与表达模式。在本文中,我们将一同了解几篇旨在利用机器学习与深度学习技术解决这一难题的重要论文。

Deep Speech 1: 实现端到端语音识别的向上扩展

本文作者来自百度研究所的硅谷人工智能实验室。Deep Speech 1不需要音素字典,而是使用经过优化的RNN训练系统,旨在利用多个GPU实现性能提升。该模型在Switchboard 2000 Hub5数据集上实现16%的错误率。之所以使用GPU,是因为其需要投入数千小时进行模型数据训练。此外,该模型还能够有效应对嘈杂的语音采集环境。

Deep Speech: Scaling up end-to-end speech recognition


Viewing all articles
Browse latest Browse all 1056

Trending Articles