フリーの歌声合成ツール「UTAU」に新展開!?より自然に聞こえる「連続音音源」とは?

予想以上に早く目が覚めてボケーッと2ちゃんを巡回していたらこんなものが…。
まぁ、まずは何も考えず原曲から聞いてみてください。


そして次に、「連続音音源」なるものを使用したこちらをお聞きください。


これには正直驚きました。
素晴らしいの一語。

動画の説明にも書いてあるように、「前の音からの遷移を含んだ音源」だそうで、これをdiphone方式と呼ぶそうです。
Wikipediaにもこう書いてありました。

Diphone合成 (Diphone synthesis)
音声ライブラリにターゲットとする言語のDiphone(音と音のつながり部分)を全て持ち、それを使用して合成する。


つながりに違和感がある、聞き取りにくいと言われるUTAUですが、音源の工夫次第でここまで変わるとは…。
約2年前、初めて初音ミクの歌を聞いた時と同じくらいの衝撃を受けました。
そしてもっと聞きたい!

今後のUTAU音源の発展、近い将来出るであろうVOCALOID3…次世代の合成音声も面白いことになりそうですね!!
あー-、生きるの楽しいなあチクショー。

この記事へのコメント

星崎 竜輝
2009年08月02日 20:57
各方面で色々な動きがあるみたいですよね。
最近のニュースで話題になったもの(?)
として、富士通の新方式音声合成技術がそれにあたるかな。
http://www.technobahn.com/news/200907271823

ナレーションの品質の80%に相当するスコアってもう驚異的
としかいいようがないです。。。
すこし調べてみたところ、歌もいけそうな、説明文が
あるのにびっくりしました。
http://jp.fujitsu.com/group/labs/techinfo/techguide/list/voice-processing.html

歌も喋りも複合エンジンに相当するものがでてきたりすると、
ワクワクしますね。
今後の展開に期待したいです。
B
2009年08月02日 21:03
私もこれ、朝から眠気覚めました。
前に母音持ってきてきれいにつなげてwavファイルに出せば
似たようなことがUTAUだけでできるかなーと漠然と考えていたんですが、
やっぱり連続音を一から作らないとだめだ、と思うようになりました。

手に負えるかなあ、こんなに進化してw
劣紅ケイ
2009年08月02日 22:30
!!こっこれが、無料配布・・作れる気はしませんが・・
UTAUが進化した・・・(゜Д゜)
これは、すごいですね・・
UTAUがこれだけになったら次のボカロどうなるんだと期待が出て来ますね。

DA18
2009年08月05日 01:13
これは凄いな…
確かにボカロに応用されたら凄い事になりそうではあるが…
ミクのアップデートとかで様子見とかしてくれないものかw
ヒオカ
2009年08月07日 20:03
>>星崎 竜輝さん
>富士通の新方式音声合成技術
コレは凄そうですね。
記事に「独自の発話リズム制御モデルと大規模な音声波形データベースを組み合わせたもの」とあるので、今すぐ民生レベルにとはいかなそうなのがちと残念ですねぇ…。
大量のサンプリング音声があれば合成音声としては優秀なものができるのでしょうが、少ないサンプリングからいかに工夫して声を再現するかという試みから歌と喋りができるものが出てくると面白いんですが…。
特に組み込み機器向け用途とか対話ロボットでの利用とか、夢がひろがりんぐですw

>>Bさん
私は初めてこの方式を知りました。
言われてみればなるほど、と思いましたw
何よりも、私のような素人でも聴いてわかるだけの変化があるというのは、絶大なインパクトです。
これでUTAUに興味を持った人もたくさんいるはずですから、まだまだこれからが勝負でしょう!!
未来の優秀なUTAUマニピュレーターもいるはず!

>>劣紅ケイさん
ボカロ側にも良い意味でプレッシャーになるんじゃないでしょうかね。
不動の地位に胡坐をかくよりは、切磋琢磨した方が互いにとって良いことだと思います。

>>DA18さん
VOCALOIDも似たようなことを内部で自動処理している、と誰かが言ってました。
本当かどうかはわかりませんがw
例の音声収録時の「呪文」も何か関係あるんじゃないですかね。

この記事へのトラックバック