将BERT用于语音识别！滴滴提出新无监督预训练框架，中文识别性能提升10%

滴滴AI Labs语音团队在论文《使用无监督预训练提升基于Transformer的语音识别》中，新提出一种基于Transformer的无监督预训练算法，创新性地将自然语言处理中的BERT等算法的思想推广到了语音识别领域。能利用极易获取的未标注的语音数据，大幅提升了语音识别精度。

论文结果显示，通过简单的无监督预训练，中文语音识别任务能得到10%以上的性能提升。具体地，在中文语音识别数据集HKUST上的结果显示，当仅使用HKUST数据库数据做预训练时，字错误率能达到23.3%（目前文献中最好的端到端模型的性能是字错误率为23.5%）；当使用更大无监督数据库做预训练时，字错误率能进一步降低到21.0%。

该论文工作不仅向学术界提出一种使用无监督预训练提升语音任务精度的方法，从实验结果中也可以发现识别性能能够随着无监督数据量的增加而提升。这是一个工业界上标注资源有限条件下的探索和尝试，具有非常强的业务落地价值：在工业界产品中可以减少对标注数据的依赖，在特定领域下，标注数据需求可能从上万小时下降到千小时、百小时，这可以有效降低搭建高质量语音识别系统的成本。

以下是对论文的详细解读：

语音识别技术已广泛的应用在各领域的工业产品。搭建一套高质量的语音识别系统通常需要花费巨大的投入来获取足够的标注数据。同时，通过各已有的在线工业系统，可以轻松的获取大量的未标注的语音数据。无论是在学术界还是在工业界，探索如何有效的使用这些未标注数据来提升语音识别系统精度，都是十分有价值的。

点击查看原文>

将BERT用于语音识别！滴滴提出新无监督预训练框架，中文识别性能提升10%

Trending Articles

[奇怪机翻组] 过分色气的深见君 / Yatara Yarashii Fukami-kun - 01 [WebRip] [1080P...

[ReinForce] 吸血鬼同盟 Dance In The Vampire Bund (BDRip 1920x1080 x264 FLAC)

有人買民雄嘉大博識嗎?(或美銓建設以前的建案)

JVID女郎搞暗黑《延禧》

MAME 0.277 免安裝中文版 - 街機遊戲模擬器

Photoshop.CS6 (免安裝隨身版隨插即用 ) (直接下載)

行星绕恒星边飞边解体令科学家惊心动魄

【日语无字】春之钟.Haru.no.kane.1985.JAP.vhsrip.NoSub.by.xiongzaixia&vivi

竹北高鐵第一豪宅若山怎麼了？竹北高鐵第一豪宅若山怎麼了？

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

出售: sound mechanics 音響架

关门一家亲：习远平、张澜澜、徐才厚

[转载]梦瑜伽三梦大法梦瑜伽的修行方法

詐騙猖獗網路名師也中鏢江兆君(小M老師)：學員勿上當！

Windbg 指令與分析之教學筆記

Office 安装管理器，一键下载/安装//打包ISO！支持2016-2024/365全版本！微软官方下载安全可靠！

回顧廿六年前北角地盤籠

【追新番字幕組】★[簡日雙語][ 勇者義彥和被引導的七人 12 最終回 / ゆうしゃヨシヒコとみちびかれしななにん Yusha Yoshihiko to...

C88圣战首日吸引18万人参战！会场工作人员名言汇总

SFC超級任天堂釣魚太郎1.2.3 (海釣太郎) 遊戲+金手指+模擬器！