搜狗語(yǔ)音變聲功能亮相Rebuild 2019:王小川秒變“高曉松”
- 來(lái)源:互聯(lián)網(wǎng)
- |
- 2019-05-27
- |
- 0 條評(píng)論
- |
- |
- T小字 T大字
中新網(wǎng)5月24日電 人工智能技術(shù)的突破,讓我們確信,未來(lái)正在迎面而來(lái)。在可預(yù)見(jiàn)的未來(lái),我們與機(jī)器的關(guān)系究竟是怎樣?人類(lèi)是否會(huì)被機(jī)器取代?這可能是大多數(shù)人都想過(guò)的問(wèn)題。
搜狗CEO王小川在2019年5月24日,“BMW • 極客公園 Rebuild 2019”科技商業(yè)峰會(huì)上,發(fā)表了題為“人與機(jī)器的共創(chuàng)未來(lái)”的主題演講,面對(duì)大眾對(duì)人工智能技術(shù)的好奇與擔(dān)憂(yōu),他說(shuō)我們不用妄自菲薄,也不用狂妄自大,人與機(jī)器的關(guān)系最終是協(xié)同進(jìn)化。而王小川在峰會(huì)現(xiàn)場(chǎng)展示的“語(yǔ)音變聲”黑科技,也讓觀(guān)眾們領(lǐng)略到了人工智能的力量。

搜狗語(yǔ)音變聲功能:從王小川到“高曉松”
在峰會(huì)現(xiàn)場(chǎng),王小川展示了一款由搜狗自主研發(fā)的語(yǔ)音變聲功能。王小川用語(yǔ)音變聲功能說(shuō)了一段話(huà),出乎意料的是,大家聽(tīng)見(jiàn)的卻是知名音樂(lè)人高曉松的聲音。它的實(shí)時(shí)逼真引來(lái)現(xiàn)場(chǎng)一片驚嘆,觀(guān)眾意猶未盡,于是王小川又演示了一次方言之間的瞬時(shí)轉(zhuǎn)換,將普通話(huà)實(shí)時(shí)轉(zhuǎn)換成了東北話(huà),表達(dá)的內(nèi)容也完全不受影響。
大家拿出手機(jī)躍躍欲試,發(fā)現(xiàn)搜狗輸入法“變聲”功能中為用戶(hù)準(zhǔn)備的語(yǔ)音角色非常豐富,橫跨互聯(lián)網(wǎng)、明星類(lèi)、動(dòng)漫類(lèi)等多個(gè)類(lèi)別,有近20種大類(lèi)的聲音,包含了大家耳熟能詳?shù)臒o(wú)厘頭星爺、蠟筆小新、小豬佩奇等多個(gè)不同年齡、不同性別甚至是不同“次元”的角色。在固定的人物和角色之外,還有大叔音、蘿莉音、公子音、御姐音等基礎(chǔ)聲音,聊天過(guò)程中,可以在這些角色中自由轉(zhuǎn)換、無(wú)縫對(duì)接。
語(yǔ)音變聲功能,正是一種人工智能
語(yǔ)音變聲功能,是搜狗團(tuán)隊(duì)人工智能技術(shù)的最新突破。據(jù)王小川介紹,語(yǔ)音變聲功能對(duì)用戶(hù)本身的音色沒(méi)有任何限制,任何一個(gè)用戶(hù)只要在語(yǔ)音輸入中輸入想說(shuō)的話(huà),再選擇一個(gè)喜愛(ài)的角色,聲音就會(huì)瞬間被轉(zhuǎn)換成該角色的聲音,真正實(shí)現(xiàn)了“任意人變聲到同一人”的神奇變化。
尤其令觀(guān)眾感到不可思議的是,搜狗的這個(gè)變聲功能不僅可以將用戶(hù)說(shuō)話(huà)的音色實(shí)現(xiàn)惟妙惟肖的轉(zhuǎn)換,同時(shí)語(yǔ)速、停頓、情感等說(shuō)話(huà)的韻律習(xí)慣均可被轉(zhuǎn)換為超高逼真度的指定角色聲音習(xí)慣,實(shí)現(xiàn)了更自然的變聲溝通。更加令大家振奮的是,目前這項(xiàng)前沿技術(shù)已被應(yīng)用到手機(jī)版的搜狗輸入法中,這是行業(yè)內(nèi)首次將變聲能力落實(shí)到大眾消費(fèi)品中。
讓機(jī)器實(shí)現(xiàn)人工智能,首先要解決的就是機(jī)器對(duì)人類(lèi)語(yǔ)言的理解處理能力,而表征學(xué)習(xí)是機(jī)器學(xué)習(xí)的根本,此次搜狗能實(shí)現(xiàn)如此驚人的變聲功能,就是源于他們?cè)谡Z(yǔ)音表征學(xué)習(xí)和語(yǔ)音合成等領(lǐng)域的突破性進(jìn)展。
從好玩到顛覆,語(yǔ)音變聲的大未來(lái)
“我們?yōu)槭裁磿?huì)花費(fèi)大量資源打造出這樣一個(gè)功能?大家現(xiàn)在可能覺(jué)得它只是好玩”,王小川在臺(tái)上發(fā)言道:“可當(dāng)我跟網(wǎng)絡(luò)教育行業(yè)進(jìn)行溝通的時(shí)候,整個(gè)行業(yè)沸騰了。在遠(yuǎn)程的直播行業(yè)當(dāng)中,我們遇到有些老師帶有口音,我剛才是把一個(gè)普通話(huà)轉(zhuǎn)成帶有東北腔,但倒過(guò)來(lái)你口音能轉(zhuǎn)成正常的語(yǔ)音,在知識(shí)付費(fèi)的這種遠(yuǎn)程教育當(dāng)中,這些學(xué)校的老師,或者說(shuō)之前找的導(dǎo)游,會(huì)對(duì)他們有一個(gè)新的顛覆!
眾所周知,搜狗擁有中國(guó)最大的輸入法產(chǎn)品,而現(xiàn)在,搜狗是中國(guó)今天To C領(lǐng)域語(yǔ)音識(shí)別量最大的引擎,每天有超過(guò)6億次語(yǔ)音識(shí)別請(qǐng)求,這為搜狗進(jìn)行語(yǔ)音相關(guān)的人工智能研發(fā)提供了豐富的數(shù)據(jù)基礎(chǔ),成為搜狗專(zhuān)注自然語(yǔ)言處理研究的獨(dú)有優(yōu)勢(shì)。目前,搜狗在人工智能上的研發(fā)主要集中于聲音識(shí)別和分析、圖像識(shí)別、語(yǔ)義理解及機(jī)器翻譯幾大部分,基于機(jī)器同傳、人臉遷移、唇語(yǔ)識(shí)別等方面的突破進(jìn)展,已經(jīng)推出了問(wèn)答機(jī)器人汪仔、搜狗地圖“智能副駕”、語(yǔ)音實(shí)時(shí)轉(zhuǎn)文字工具“搜狗聽(tīng)寫(xiě)”、虛擬主播、旅行翻譯寶、錄音翻譯以及結(jié)合分診和醫(yī)療搜索功能的“搜狗明醫(yī)”等多個(gè)采用了人工智能的產(chǎn)品。
在演講最后,王小川說(shuō):“未來(lái)人跟機(jī)器會(huì)有一種新的合體,跟技術(shù)在一塊我們會(huì)變得更加強(qiáng)大,形成新的生態(tài),這是人與機(jī)器協(xié)同進(jìn)化的未來(lái)。”顯然,科技的發(fā)展,正在改變我們與周邊環(huán)境的交互習(xí)慣,機(jī)器與人類(lèi)的關(guān)系,也不再只是簡(jiǎn)單的工具與使用者,它會(huì)更加智能地幫助人類(lèi)延伸自身能力,以觸達(dá)更加廣闊的領(lǐng)域。
- 標(biāo)簽:
- 編輯:王麗
- 相關(guān)文章