ボカロとUTAUと人力ボカロ

ちょっと語ってみたくなったので。

07,08年には考えられないくらい、VOCALOIDもだいぶメジャーになってきましたが、
ニコ動には「歌わせる」ということで、
他にUTAUと人力ボカロというジャンル(?)があります。
今回の合作で人力ボカロやったので、
ちょっと人力ボカロとは何ぞということについて語ろうかと。

先に一応「音素」っていう用語解説だけ。
音声学的に日本語は所謂「50音」じゃなくて、
文字表記と認識は同じ「ん」や「え」でも実際の発音は違うんだけど、
それを気にしないで俺らが同じって思ってるヤツは同じ音ってことにしようぜ!
っていうことにした「音」。

「音素」「音」「音程」って出てくるからややこしいかもしれないけど。


まずVOCALOID
VOCA.jpg
YAMAHAが開発した歌声音声合成システムとその商品名。
音源の発売元とVOCALOIDのシステムは別ね。
有名なのがクリプトン社の初音ミク。

YAMAHAの音声合成システムの技術を提供されて、
各社がその方法で音源を録音加工してるわけだ。
ユーザーは音程と音素を入力してくれれば、
ある程度は自然に音が繋がるように仕組みがなってる。
あとピッチやら細かいパラメーターもいじれる。
特徴は、有償ソフトってのと、誰でも(ある程度は)気軽に簡単に歌わせられる。


そんでもってUTAU
UTAU.jpg
UTAUはサンプラーなんだね。
「音声をまとめたファイルを使用し、フォルマントを保ちながらピッチを変更でき、タイムストレッチに対応した音声結合ツール(by wikipedia)」。
分かりにくいんだけど、簡単に言うと、
・音素ごとに音声ファイルをまとめてある
・その音素だと認識できる状態で音程を変えられる
・音を伸ばせる
特徴は、フリーウェア、音源をユーザーが作れる。
有名なのが重音テト。
フリーなので、大量にライブラリがあるのも特徴だね。

パッと見は、フリーのボカロです。でも仕組みが違う。
仕組みが違うから、母音と次の子音の繋ぎを良くするためには、
「連続音源」と呼ばれてる音を組み合わせなきゃ自然にならなかったりするわけだ。
ボカロはその辺を自動判別処理してくれる。
後ボカロとの違いは多分サンプル数が少ない(基本は一音階の録音)ので、
音程が変わり過ぎると結構声が崩れる。
それの対策として高音用低音用を用意してあるライブラリもあるけどね。


最後に人力ボカロ
DAW.jpg
これは人の歌声を切り貼りした所謂音MAD。
手作業なんですわ。
以下あくまでも私のやり方。

1.歌って欲しい人の音声を用意する。
 今回だと日本さんのキャラソンを用意しました。
 声だけを抜き出す方法はぐぐれば出ます。
 アニメの声を抜き出してもできると思うけど、やりやすいかは不明。

2.歌ってもらう曲を聞きながら各音素の各音程に近い音を切り取る。
 ここがメインの作業。
 音の切り出しの時に気をつけるのは次の点
 [A]同じ音素、さらにできるだけ同じ「音」を切り出す。
 [B]できる限り近い音程を切り出す。
 [C]できる限り前の母音が同じものを切り出す。

3.ピッチ補正
 2で作ったデータをフリーズ(wav書き出し)して、歌の音程にピッチを補正。
 私は音程がわかんなくなったりするので、一度ボカロでmidi作って、
 楽譜代わりにそれを見ながら補正してます。

4.ミックス
 3のデータをオケと普通にミックス。

私は2-3までは全部MusicMaker上でやってます。
元々DTMやるのにMusicMaker買ってたんですが、
波形編集もピッチ補正もできて便利。安いし。

2がまあ肝なんですが。

[A]は基本。
日本語の音素の発音にも色々あって、例えば子音の長さと母音の長さ。
「すごい色ですー」の最初の「す」は無声子音、後の「す」は有声子音。
あと発声。
囁くように歌ってるとこと声を張り上げてるとこを並べると変。

[B]もそこそこ重要で、音程がだいぶ違う音は、ピッチ補正すると別人の声になります。
機械っぽくもなるし。
UTAUで作った人力ボカロにも機械っぽくなってるのが多い。
手作業の人力ボカロだと、そこに適した音程に近い音素を切り抜いてこれます。
って言うけど、これ大変だったわぁ。
まず同じ音素を探すのもキャラソンの最初から最後まで聞いてここ!
って切り抜いてきて、
音程がちょっと違うなって思ったらまた聞いて切り抜いてきて、
どっちも違うなーって思ったら二つを比べて近い方を並べて…を全歌詞分。

次に[C]だけど、[B]は音程の自然さですが[C]は言葉の繋がりの自然さ。
そのまま並べただけだとやっぱりカタコトになっちゃう。
Trust meはスタッカートが効いた曲だから、ラッキーだったけど。
例えば「から」とかは原曲にあった「から」を使ってるのでここの繋がりは自然。
UTAUで言う所の連続音みたいな使い方を手作業でもすると自然になるってことです。
例えば「きみ」だったら「Ki」と「□iMi」っていうのを繋げる。
□に入るのはK,S,T,N,M,Yなんでもいい。
まあ今回そんなにやってないけどね!ちょっとやったけど。

最後に「ない音素」を作るっていう作業。
「元のキャラソンに存在しない音素」っていうのがあるのね!
今回も3つくらいありました。
これは子音と母音を組み合わせて作ったりするよ(なげやり)。


まあ以上って感じです。
UTAUで作った人力と、手作業の人力は、聞いたら分かります。
前に「UTAUは人力にあらず!」とか言っていた時期があったんですが、
そういえばUTAUは
「人力ボカロ支援ツール」として出て来たことをすっかり忘れていました。
すいませんでした。
UTAUは気軽に色んな曲を歌わせられて楽しいんだけど、
やっぱり人力っていうののクオリティ的には、手作業が良いと思ってますし、好きです。

が、決してUTAUは簡単にできるって言ってるワケじゃないです。
原音設定大変だし(やったことある)。
あくまでも自分の好みの話なんで。


と言うわけで語りたいだけ語った。

コメントの投稿

非公開コメント

プロフィール

のののP

Author:のののP
絵描いたり動画作ったり歌ったり3Dモデリングしたりゲームしたり。

■ニコ動
mylist/2325248
■youtube
nononoP00
■Pixiv
id=141058
■連絡
opm_niconico○yahoo.co.jp
○→@

MMD配布系まとめ
PMDE講座まとめ
blender tips

配布物以外の無断使用禁止。

商用利用、商業依頼については上記連絡先までメール下さい。

カテゴリー
アーカイブ
ブログ内検索
リンク
RSSフィード