Cloud Text-to-Speech 技術加入 Google雲端平台

分類: 其他 新品報導發布時間: 2018/03/29 14:00

本文作者：雲端人工智慧產品經理 Dan Aharon

許多Google產品(像是Google Assistant、Google搜尋、Google地圖等)都內建了高品質的Text-to-Speech服務，可以產生如人聲般自然的發音。我們收到許多開發者的意見，表示希望能將Text-to-Speech的服務結合到他們的應用程式中，所以今天，我們特別將這項Cloud Text-to-Speech技術加入Google雲端平台(Google Cloud Platform, GCP)中。

使用者可以將Cloud Text-to-Speech服務運用在不同的情境中：

- 為電話語音服務(Interactive Voice Response, IVR)中心提供語音回應系統，並啟用即時自然語言對話功能
- 與物聯網設備，如電視、汽車、機器人等進行對話
- 將文字格式的媒體內容(如新聞文章、書籍)轉為口語形式(如Podcast、有聲書)

Cloud Text-to-Speech服務提供了12種不同語言中的32種不同聲音供使用者選擇。即使是複雜的文字內容，例如姓名、日期、時間、地址等，Cloud Text-to-Speech服務也可以立刻發出準確且道地的發音，並支援多種音檔格式，包含MP3和WAV等，不僅如此，使用者還可以自己調整音調、語速和音量。

[廣告]
Text-to-Speech服務結合DeepMind技術
我們也很開心宣布，Cloud Text-to-Speech服務更以DeepMind所建構的原始音檔生成模型WaveNet為基礎，透過運用WaveNet將一系列高保真度的聲音轉化為語音。整體而言，WaveNet可以合成並產出更自然的語音細節，而且相較於其他Text-to-Speech技術所產生的語音內容，WaveNet所產出的語音內容也更受使用者喜愛。

在2016年底，DeepMind推出了第一版的WaveNet，透過神經網路架構來訓練大量的語音樣本並創造原始音頻的波形。在訓練過程中，神經網路會擷取語音的基本架構，像是語調的連接和語音波形的形狀等。當輸入特定的文字內容時，經過訓練的WaveNet模型會產生相對應的語音波形，藉由一次產生一個樣本的方式，達到比其他方法更高的準確度。

現在，我們使用的運行於Google雲端TPU基礎架構上的更新版WaveNet。全新且升級的WaveNet模型所生成的原始音頻波形比原本的模型快了1,000倍，而且只需50毫秒即可生成一秒鐘的語音訊息。事實上，這個新模型不僅更快速而且具有高保真度，且每秒能創造出24,000個音頻波形的樣本。為了製作出更好、更擬真的音質，我們也將每個樣本的解析度從8位元提高到16位元。

藉由上述調整，新的WaveNet模型可以製作出更自然的語音訊息。在測試過程中，使用者在1到5級的平均意見分數(Mean-opinion-score, MOS)量表中，給予新版美式英文WaveNet語音4.1的高分，其中有超過20%的人認為比標準的人聲更好，而超過70%的人肯定它能降低人類語言的隔閡。由於WaveNet音訊僅需較少錄製音頻，就能製作出高音質模型，因此我們預計在未來幾個月內，將持續改善WaveNet音訊的多樣性與品質，並提供給雲端客戶使用。

Cloud Text-to-Speech已經協助很多我們的客戶，像是思科(Cisco)和Dolphin ONE，提供更好的終端使用者體驗。

「身為提供協作解決方案的領導者，思科長久以來致力於為企業提供最新的技術。Google的Cloud Text-to-Speech服務協助我們提供給客戶他們所期待的自然人聲。」－思科認知協作技術長 Tim Tuttle

「Calll by Dolphin ONE的電信平台在幾乎全球各地都能提供使用者多重設備的連接服務。我們將Cloud Text-to-Speech工具與我們的產品結合，為顧客能體驗到最自然的語音客服。透過使用Google Cloud的機器學習工具，我們能即時將最新科技提供給我們的使用者。」Dolphin ONE, Jason Berryman

馬上開始體驗Text-to-Speech服務
有了Cloud Text-to-Speech服務，你只需要透過點擊就能體驗到全球最先進的語音科技。想瞭解更多詳細資訊，請參考相關文件或價目表；想要試用公開測試版或體驗新的語音服務，請前往Cloud Text-to-Speech的網站。

⊙ Google Maps 路徑規劃加入 Uber 叫車功能 [3/24/2016]

市場快報

神腦年中慶開跑指定商品最高贈2500神腦幣 iPhone換電池最高省800元

燦坤3C家電年中慶開跑指定商品5折起滿額抽旅遊金

神腦國際攜手FutureDial打造全台首創手機健康管理中心

燦坤會員寵物卡週年慶寵物價商品54折起

BRITA 攜手《怪奇物語》女星米莉芭比布朗打造新世代喝水風潮

哈燒王 Hot3C

Cloud Text-to-Speech 技術加入 Google雲端平台

分類: 其他 新品報導發布時間: 2018/03/29 14:00

相關文章:

⊙ Google Maps 路徑規劃加入 Uber 叫車功能 [3/24/2016]

⊙ [「擇法善思林之蘭室藏津」的緣起]

⊙ 確定了！新北捷運三鶯線6/30下午通車當日至8/31試營運免費搭

⊙ 軌面水退台鐵中洲至岡山上午9時恢復雙線行車

⊙ 內湖淹水掀清溝爭議！蔣萬安：退水快證明清疏沒問題

⊙ MLB》U18世界盃被美國超級左投震撼賴謙凡發憤圖強

⊙ 嗆「檯面下隨您」遭控恐嚇、私吞公款！澎恰恰挨告3罪結局反轉

⊙ 高雄今停班課！高醫體系正常營業另3家醫學中心改豪雨門診

⊙ 男性50歲後常夜尿、解不乾淨？醫示警：恐是攝護腺肥大

⊙ 國產防空超級大腦「寰展計畫」年底完工！「台灣之盾」AI智慧大升級

⊙ 澎湖縣長參選人葉竹林提打造離島一日生活圈讓七美、望安不再遙遠

⊙ 捷運三鶯線即將通車三峽鶯歌周邊路段路邊機車格7/1起收費

⊙ 原民音樂黑科技曝光！高蕾雅帶頭玩「AI做音樂」驚人單元網讚：辣麼LitHigh

⊙ 設抽水站增加抽水機組台南北門蘆竹溝通過豪雨考驗不淹了

⊙ 高雄豪雨不斷釀災大樹往義大方向土石流失阻交通

⊙ MLB》為什麼簽下賴謙凡？洋基球探高層點出關鍵因素

⊙ 世足》神撲救為日本守住和局！門神鈴木彩艶：對巴西非贏不可

⊙ [擇法善思林之蘭室藏津]

市場快報

哈燒王 Hot3C

Cloud Text-to-Speech 技術加入 Google雲端平台

分類: 其他 新品報導 發布時間: 2018/03/29 14:00

相關文章:

⊙ Google Maps 路徑規劃加入 Uber 叫車功能 [3/24/2016]

⊙ [「擇法善思林之蘭室藏津」的緣起]

⊙ 確定了！新北捷運三鶯線6/30下午通車 當日至8/31試營運免費搭

⊙ 軌面水退 台鐵中洲至岡山上午9時恢復雙線行車

⊙ 內湖淹水掀清溝爭議！蔣萬安：退水快 證明清疏沒問題

⊙ MLB》U18世界盃被美國超級左投震撼 賴謙凡發憤圖強

⊙ 嗆「檯面下隨您」遭控恐嚇、私吞公款！澎恰恰挨告3罪 結局反轉

⊙ 高雄今停班課！高醫體系正常營業 另3家醫學中心改豪雨門診

⊙ 男性50歲後常夜尿、解不乾淨？ 醫示警：恐是攝護腺肥大

⊙ 國產防空超級大腦「寰展計畫」年底完工！「台灣之盾」AI智慧大升級

⊙ 澎湖縣長參選人葉竹林提打造離島一日生活圈 讓七美、望安不再遙遠

⊙ 捷運三鶯線即將通車 三峽鶯歌周邊路段路邊機車格7/1起收費

⊙ 原民音樂黑科技曝光！高蕾雅帶頭玩「AI做音樂」 驚人單元網讚：辣麼LitHigh

⊙ 設抽水站增加抽水機組 台南北門蘆竹溝通過豪雨考驗不淹了

⊙ 高雄豪雨不斷釀災 大樹往義大方向土石流失阻交通

⊙ MLB》為什麼簽下賴謙凡？ 洋基球探高層點出關鍵因素

⊙ 世足》神撲救為日本守住和局！門神鈴木彩艶：對巴西非贏不可

⊙ [擇法善思林之蘭室藏津]

相關新聞

相關新聞

市場快報

分類: 其他新品報導發布時間: 2018/03/29 14:00

⊙ 確定了！新北捷運三鶯線6/30下午通車當日至8/31試營運免費搭

⊙ 軌面水退台鐵中洲至岡山上午9時恢復雙線行車

⊙ 內湖淹水掀清溝爭議！蔣萬安：退水快證明清疏沒問題

⊙ MLB》U18世界盃被美國超級左投震撼賴謙凡發憤圖強

⊙ 嗆「檯面下隨您」遭控恐嚇、私吞公款！澎恰恰挨告3罪結局反轉

⊙ 高雄今停班課！高醫體系正常營業另3家醫學中心改豪雨門診

⊙ 男性50歲後常夜尿、解不乾淨？醫示警：恐是攝護腺肥大

⊙ 澎湖縣長參選人葉竹林提打造離島一日生活圈讓七美、望安不再遙遠

⊙ 捷運三鶯線即將通車三峽鶯歌周邊路段路邊機車格7/1起收費

⊙ 原民音樂黑科技曝光！高蕾雅帶頭玩「AI做音樂」驚人單元網讚：辣麼LitHigh

⊙ 設抽水站增加抽水機組台南北門蘆竹溝通過豪雨考驗不淹了

⊙ 高雄豪雨不斷釀災大樹往義大方向土石流失阻交通

⊙ MLB》為什麼簽下賴謙凡？洋基球探高層點出關鍵因素