免费观看已满十八岁电视剧国语_人妻 色综合网站_欧美大尺寸suv视频_成人免费高清在线观看_久久久成人毛片无码_老头解开奶罩吸奶头高潮视频_sm调教室论坛入口_欧美夫妻交换久久丫1000_一级黄色大片在线免费观看了

首頁 > 重磅

谷歌開源AI能區(qū)分聲音 準確率達92%

2018/11/13 14:11      網(wǎng)易科技 小小 [No.L001]


295_meitu_1.jpg

  (圖片來源:云圖視覺)

  11月13日消息,據(jù)VentureBeat報道,在語音嘈雜的環(huán)境中,要想分辨出有幾個人講話、在什么時間講話,對于機器來說非常困難。但谷歌人工智能(AI)研究部門在語音識別方面取得了新進展,能以92%的準確率識別出每個人聲音的專屬模式。

  谷歌AI研究部門在最新名為《Fully Supervised Speaker Diarization》的論文和相關博客文章中,研究人員描述了一種新的AI系統(tǒng),它“能以一種更有效的方式識別聲音”。

  這套系統(tǒng)涉及到Speaker diarization任務,即需要標注出“誰”從“什么時候”到“什么時候”在說話,將語音樣本分割成獨特的、同構片段的過程。強大的AI系統(tǒng)必須能夠將新的演講者發(fā)音與它以前從未遇到過的語音片段關聯(lián)起來。

  這篇論文的作者聲稱,核心算法已經可在Github上的開源軟件中可用,它實現(xiàn)了一個在線二值化錯誤率(DER),在NIST SRE 2000 CALLHOME基準上是7.6%,這對于實時應用來說已經足夠低了,而谷歌之前使用的方法DER為8.8%。

99.jpg

  (圖片來源:云圖視覺)

  谷歌研究人員的新方法是通過遞歸神經網(wǎng)絡(RNN)模擬演講者的嵌入(如詞匯和短語的數(shù)學表示),遞歸神經網(wǎng)絡是一種機器學習模型,它可以利用內部狀態(tài)來處理輸入序列。每個演講者都從自己的RNN實例開始,該實例不斷更新給定新嵌入的RNN狀態(tài),使系統(tǒng)能夠學習發(fā)言者共享的高級知識。

  研究人員在論文中寫道:“由于該系統(tǒng)的所有組件都可以在監(jiān)督環(huán)境下學習,所以在有高質量時間標記演講者標簽訓練數(shù)據(jù)的情況下,它比無監(jiān)督系統(tǒng)更受青睞。我們的系統(tǒng)受到全面監(jiān)督,能夠從帶有時間戳的演講者標簽例子中學習。”

  在未來的工作中,研究團隊計劃改進模型,使其能夠集成上下文信息來執(zhí)行脫機解碼,他們希望這將進一步減少DER。研究人員還希望能夠直接對聲學特征進行建模,這樣整個Speaker diarization系統(tǒng)就可以進行端到端訓練。

  榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復制
標題鏈接已成功復制

最新新聞

熱門新聞

丫鬟被扒下内裤打光屁股| 777人成免费观影| 理论片中文字幕在线观看| 久久精品视频区| 成年人在线免费网站| 素人视频在线观看免费| 九九九九九少妇爽黄大片| 亚洲裸男gay| 师尊攻肉h文| 日剧大尺度床戏做爰吻胸| 男婴交从小就做h高辣| 女人又爽又黄免费女仆| 欧美性猛交xxxx秘书| 中文字幕日韩欧美精品高清在线| av黄色毛片| 苟苟by夏小正全文免费阅读| 性生交大片免费动作| 夜班护士与医生啪| 久久69精品久久久久久久电影好| 亚洲色图清纯唯美| 苏曼女王的足奴sm视频| 国产全肉乱妇杂乱视频男男| 美女张开腿给男人桶爽免费软件| 裸体武打性艳史电影| 亚洲精品视频中文字幕| 国产a国产片| 国产麻豆视频| 又色又爽又黄18网站| 高h喷水荡肉爽腐男男并用小玩具| 重囗味调教黄金大便喝尿小说| 全部孕妇毛片丰满孕妇孕交a| 办公桌下吞吐巨大h| 国产在线观看麻豆| 奴隶色の女教师3| 羞羞视频污| 伊人成人222| 教官脱了男生内裤摸j的小说| 日本黄漫在线观看| 国产又粗又硬又爽的视频| 金梅瓶在线观看免费全集高清完整| 寡妇高潮免费视频一区二区三区|