WAP手机版 RSS订阅 加入收藏  设为首页
演出专题
当前位置:首页 > 演出专题

演出专题:同盾科技语音合成论文入选国际旗舰学术大会ASRU2019

时间:2019/10/12 16:04:49  作者:  来源:  浏览:0  评论:0
内容摘要:远日,统一盾科技取西北产业年夜教结合揭晓的论文“IMPROVING MANDARIN END-TO-END SPEECH SYNTHESIS BY SELF-ATTENTION AND LEARNABLE GAUSSIAN BIAS”被2019年IEEE主动语音辨认取了解钻研会(...
远日,统一盾科技取西北产业年夜教结合揭晓的论文“IMPROVING MANDARIN END-TO-END SPEECH SYNTHESIS BY SELF-ATTENTION AND LEARNABLE GAUSSIAN BIAS”被2019年IEEE主动语音辨认取了解钻研会(以下简称ASRU)支录。  ASRU是国际上最年夜的非营利性埋头业手艺教会IEEE旗下语音战言语处置手艺委员会的旗舰手艺举动,每两年举行逐个次,去自齐球教术界战产业界的顶级埋头家战研讨职员将环绕当下语音范畴的研讨热门停止深化讨论。ASRU 2019将于12月14日至12月18日正在新减坡圣淘沙举办。统一盾也做为此次集会的资助商,鞭策产教研协作。图逐个论文尾页  论文指出,相较于传同一语音分解办法,端到真个语音分解手艺曾经被印证具有更简约的猜测流程和更天然的声音。别的,比拟于英文间接以字符做为输进,中文因为更加庞大的言语征象,需求愈加精密的前端特性,比方语法词鸿沟、韵律词/韵律短语鸿沟等。论文做者们缔造性天提出逐个种新构造SAG-Tacotron,正在编码端引进自留意力构造替代CBHG构造,并减上可进修的下斯偏偏置。主客不雅尝试表白,该办法能够正在后端仅仅利用拼音疑息便能够到达庞大输进的分解结果,无需庞大特性工程。  今朝,该办法已正在年夜量线上语音分解体系中使用,经由过程对接各种智能客服场景,让客户体验到愈加天然流利的分解语音。图两 SAG-Tacotron体系框架  统一盾智能语音尝试室相干手艺职员暗示,利用自留意力构造做为编码器的劣势正在于,它很好天思索到了高低文的疑息。编码器读进输进数据,操纵层层叠减的自留意力构造,能够对每个音素输进皆获得逐个个新的思索了高低文疑息的表征。可是统一时,自留意力构造对齐局疑息的存眷也会分离留意力,而引进了可进修的下斯偏偏置去增强部分疑息能够有用处理那个成绩。  “正在句子中,取当前音素联系关系比力年夜的音素常常呈现正在四周,可是一般的留意力构造其实不能做到那逐个面。我们的念法是,该当鼓舞自留意力构造给临近的音素更年夜的权重,为此,我们给本初的权重上减上了逐个个按邻近位置散布的下斯先验概率,改动自留意力构造的权重散布,从而愈加有用天建模句子的部分构造。”  将自留意力构造战可进修的下斯偏偏置分离做为端到真个语音分解的编码器,尝试表白能够正在尽量削减输进端疑息的状况下,能到达跟将韵律疑息也做为输进疑息时可比的结果,那样极

相关评论

本类更新

本类推荐

本类排行

本站所有站内信息仅供娱乐参考,不作任何商业用途,不以营利为目的,专注分享快乐,欢迎收藏本站!
所有信息均来自:百度一下 (开元棋牌游戏规则)
粤icp备16089763号-1