動画ファイルに音声をつけたいのですが…自分でしゃべるのは嫌だし、、
できるだけ人に近い合成音声ないかなと探しているところです。
できるだけお安く使いたいのですが、仕事 (法人) 用となると、高いですね…。
で、いろいろ見ているのですが、
今日は、Googleさんが提供している Cloul Text-to-Speech (β版) を試してみます。
Googleさんのいろいろなツールでお話ししてくれてるのもコレなのかな?
12の言語 (日本語あり) と、32の音声が用意されていて、
音声速度やピッチを調整できるようになっています。
mp3など、いくつかのオーディオ出力のフォーマットがあるようです。
テスト画面が用意されているようなので、遊んでみることにしました。
これテスト画面です。既に何か書いてある。
とりあえず聞いてみる。デフォルト画面のまま、▶ SPEAK IT をクリック。
Σ(*'▽')
すごい流暢じゃないですか!
Voice type の WaveNet っていうのが、より高品質な、ヒトの声に近い音声合成を可能にしているそうです (2018年6月現在は、まだ日本語はこれには未対応のようです)。
面白い(*´з`)
日本語もやってみます。
ちょっと機械音ぽさは残るけど、でも、かなりいい感じです。
WaveNet だとどうなるのか聞いてみたい…。
WaveNet を使うには、英語を選択して、、それっぽいローマ字を入力。
………こ…これは…。。
カタコトの日本語だ!!(*´Д`) すごい。
こんな話し方の方、いる…。
うん。これはこれで。悪くはないですね。ちょっと機械っぽいけど。
これを、WaveNet (英語版) で。。
わ。やっぱり、カタコト日本語の方だ。すごいわ~。。
こんなところですかね。(*´з`)
全ての言葉を英語版で話させるのは、ちょっと難しいですけど、
これはこれでおもしろい…(笑)
これ、いつか日本語も WaveNet に対応してくれるのでしょうか?
その日がくるのが楽しみです。(*'▽')
日本語の説明もありました。テストでなくやる場合は、グーグルのIDとクレジットカード登録とかが必要なようです。本気で使うとなったら、こちらを熟読ですかね。
1年間の無料トライアルがあるようです。(*´з`)
cloudplatform-jp.googleblog.com
では、今回はこのへんで。(*'▽')/