今天,niconico動畫突然竄出了一個令人訝異的作品,不僅迅速登上排行榜,也引起了不小的迴響。那就是,透過一個叫做「MikuMikuTalk」的軟體,讓初音未來能夠單憑輸入的文字自動解析、自動說話。
【自動で】初音ミクが自動で喋るツール作ってみた!【喋らせてみた】sm13013900
【自動】試著做出讓初音未來自動說話的軟體看看!【試著讓她說話】
Dec. 13, 2010
曠世巨作降臨?
「讓身為語音引擎的軟體初音未來能像人類般富有情感地說話,遇到日文漢字也能直接發音而不需要轉為假名輸入、而且這種原先需要反覆而且冗長的調整過程還能自動化?」在影片中所展示出來的工具就真的能達到這樣的功能,還提供了三種說話模式:複誦模式(棒読モード)、朗誦模式(読上モード)和感情模式(感情モード)。
從影片的展示看來,不僅初音可以如同真人說話一般,甚至還能和MikuMikuDance連動,使用者所輸入的字句在初音說出來的同時,畫面右手邊的3D初音還能即時改變嘴型、動作與模樣,就像真的在初音中注入了靈魂一般。
這個作者稱為「MikuMikuTalk」的軟體能做到的事情實在讓人歎為觀止;而從影片範例來看,彷彿離正式版完成已經不是太遙遠的事情,更說不定體驗版已經釋放出來了。什麼時候、甚至在什麼地方,可以下載得到這個軟體呢?看過作者的影片後,實在令人不禁開始這樣遐想。
MikuMikuTalk
很可惜。
「MikuMikuTalk」目前不是擁有如此強大功能的軟體。
作者除了在影片的最後說明外,blog上的〈#0114-2__『MiuMikuTalk』の機能解説(続き)〉這篇文章中更清楚的說明了,這一切都不是真的。影片是作者本身精心調整的結果,而具備影片中功能的軟體實際上不存在,也沒有開發的打算與能力。雖然軟體是貨真價實的,但功能並不是真的,並沒有如影片所說的功能。「MikuMikuTalk」目前可以做到的,是「根據使用者的特定操作,播放事先準備好的音樂和影片」。
不過,與其說是一場騙局,其實更應該說是一個,還沒有辦法完成的夢想。由於文法分析、字義判斷、模擬兩可的語意與各式各樣存在於自然語言中難以釐清與解決的技術問題,牽涉到的範圍既廣闊又複雜,像是影片中所示範的朗誦模式,在一般的專業文本(text)發音軟體中,即使使用者手動分割句子幫軟體標重音也還是有許多不自然的地方,何況這還是很麻煩的事情。要能正確解析使用者所輸入每一句的話並對應至日文中自然的抑揚頓挫,已經是相當困難的事。
而要像是感情模式那樣,單靠使用者任意輸入的一句話(不是特定的話)不僅可以配合出正確的抑揚頓挫還能選擇出適合的表情來搭配,甚至對於含有隱喻的話也能正確解析無誤,幾乎可以說是目前作不出來的東西;目前唯一有可能的便是一般的複誦模式了,但即使如此,在日文漢字解析的部分也已經超越初音未來軟體本身的能耐,不以假名輸入也不靠軟體中須手動建置的漢字對應資料庫的話,軟體是無法辨識的。
作者在解說文章中除了說明軟體實際上是不存在的之外,也說到了製作動畫時的過程所花費的龐大心力,還談到了一些哲學的想法,如作者在文中所說的這個部分:
さて、声を作るのに心血を注ぐ私ですので、「じっくりと手間と時間をかけて声作りをすることこそが、VOCALOIDに魂を吹き込むということなのだ」と信じたい、というか実際信じているわけです。
しかしながら、この動画を作りながら、「高性能ソフトウェアにより、自動的に生成された声には、それがあたかも人間のようなリアルなの声であっても、魂は宿らないのか?」という疑問に直面した時、私は少なからず動揺しました。この疑問に「宿らない」と答えることは、そもそも「VOCALOIDに魂が宿るのか?」という問いに、「正気の沙汰とは思えない」と答えるのと同じだからです。テクノロジー至上主義とラダイト主義の対立と考えて下さっても結構です。
~「#0114-2__『MiuMikuTalk』の機能解説(続き)」から~
那麼,因為我在調整聲音投入了相當大的心力,很想相信「自己費時費力慢慢地調整聲音,就是在把靈魂注入VOCALOID」,所以實際上也就這麼相信了。
然而,在製作這個影片的同時,對於「從高性能軟體中自動生成的聲音,即使是那個彷彿真人般逼真的聲音,是否也同樣沒有靈魂寄宿其中呢?」這樣的疑問時,我有了滿大的動搖。對這個問題的回答「沒有靈魂寄宿」,和一開始問我「VOCALOID裡有靈魂寄宿嗎?」回答「正常人都不會這麼想」是一樣的。思考一下科技至上主義和盧德主義(注:反對工業化,主張回歸原始生活)的對立也是不錯的。
結語
雖然作者並不是真的完成了這樣一個神奇的軟體,不過也為廣大的vocaloid愛好者帶來了一部有意思的作品與對未來的期盼。作者花了許多力氣在動畫的製作與初音聲音的調整上完成了這個像是使用說明般的影片,而影片的描述方式也頗具趣味性,即使沒有功勞也有相當的苦勞,給大家做了一場美夢,即使離它真正實現的日子還有不少的距離。
事實上,不管是在作者的部落格或是在nico上的影片回應中,絕大部分的留言都是善意的。雖然有不滿的聲音也在所難免,不過即使知道不是真的也沒有太多刻意批評作者的回應,而是許許多多的盼望與鼓勵。大家都很享受影片的樂趣,這樣的感覺真不錯。這個影片很有趣,推薦大家欣賞。
這邊額外提一下:關於BGM中的第四首歌曲「例のアレ(老樣子的那首歌)」是nico上相當知名的灰色近限制級情色題材歌曲,而且翻唱後的歌詞比原歌詞更直接,所以初音接下來才會有「翻視窗」的反應。
以日本在機器人科技與語音引擎領域位居世界領先地位來看,日本也是最有可能領先全球率先推出這種跨時代發明的國家。總有一天,真正的「MikuMikuTalk」和它更先進的後代,一定會降臨在這世上的。