Home オススメ! お得に使える音声合成ソフトを選択、やっぱり AITalk5 がおススメ!

お得に使える音声合成ソフトを選択、やっぱり AITalk5 がおススメ!

スポンサーリンク

ソースネクストeSHOPにて、BLACK FRIDAYが開催されています。ポイント還元が大きいので、利用できる方はこの機会を狙ってみてください。

巷で音声合成ソフトがあふれかえっていることは、皆さんも意識するところではないでしょうか。電車やバスのアナウンスはほぼほぼ、音声合成ソフトで作られたものが多いと思います。音声合成ソフトは昔はライセンス料がバカ高かったのですが、それでも声優さんを一人雇うよりコスパに優れるということで、多く導入されてきました。

今回は、私がいまだに使用している音声合成ソフトを厳選して紹介したいと思います。

まず、私がいいなと思う音声合成は株式会社エーアイの業務用ソフトです。合成音の質もよく、聞き取りやすく、とても優秀です。でも個人用途には利用料が高すぎます。日常的に業務として使う分にはモトが取れるかもしれませんが、個人でここまで支払う(例えば100万越え)なら、適当な声優のバイトを雇った方がいいかもしれません。

そこで、私が愛用しているのが、同じエーアイ社の個人向けソフト、「かんたん!AITalk®5」です。一番手っ取り早く、音声ファイルを作れるので、利用しやすいです。
ちなみに、購入するならソースネクストを利用する方が、安く購入できます。

手っ取り早いというのは、比較的読み間違えもなく、読み間違えても全体の意味が滅茶苦茶になるほどひどくないというのが、使い続けている理由です。

今回は比較対象を踏まえて、容易に利用できるフリーソフト、VOICEVOXゆっくり MovieMaker と合わせて簡単に比較してみます。

上のサイトから、合成音のサンプルが試せますので、興味があったら試してみてください。YouTube 界で定番の「ゆっくり霊夢(ゆっくりMovieMaker)」と聞き比べるといいかと思います。「ゆっくり霊夢」の方は定番化しているので、聞きなじみがあると思いますが、どちらの音声の方が聴衆にアピールできるかは、内容次第という感じでしょうか。ゆっくり霊夢の方は無料で使えますので、使い分けて問題ありませんね。

受験生で年表を覚えたり、法文を覚えたりするときは、AITalk®5にコピペして、読み上げさせて、その音声データをスマホなどに転送して、通勤・通学の際に聞くというのが定番です。
私もずいぶん昔に、本ソフトをそういう目的で利用したことがあります。ただ、私が利用していた時代は「VoiceText(現:ReadSpeaker)」というソフトが定番でした。

ずいぶん昔になりますが、大手資格試験スクールで、有料販売の法文の読み上げデータがあきらさまにAITalkの音声出力そのまんまだったので、しかも読み間違え箇所もそのままAITalkと同じ箇所でした(これは購入してみて全体を聴いてみてわかりました)。そんなことなら自前で購入して、自分用のものを作ろうと入手した経緯があります。

というのも、指摘しても、その大手スクールが読み間違い個所をまったく訂正せず、そのまま押し通そうとするため、受験生としてはそのまま間違って覚えてしまうという弊害を許容せざるを得なかったからです。私の場合は、気づいた個所は自分で訂正して、テキストをAITalkに読み込ませて、当時の iPod で聞いていました。別に読み間違い程度なら、気にならない方や、要領のいい方は間違えて覚えても問題ないのだとは思います。私は無意識に覚えてしまって、本番で変なことになったらイヤだと思い、訂正しました。

実例テスト

次の文を発声させるテストをします。巷でよく使われている優秀なフリーソフトとの比較です。ライセンス料がバカ高い企業向けの商用ソフトとの比較は省きます。

契約方式の自由(改正民法522条2項)
電子契約は、このうちの電磁的記録を使った意思表示による契約にあたります。 この条文を根拠に、原則としてあらゆる契約が電子契約で締結できることが明らかになりました。
2 契約の成立には、法令に特別の定めがある場合を除き、書面の作成その他の方式を具備することを要しない。

AITalk®5 のぞみ

AITalk®5 かほ

VOICEVOX

ゆっくりMovieMaker

出力は VOICEVOX はデフォルトの24Hz モノラル PCM、AITalk®5もデフォルトの22.050Hz、16ビットモノラルPCMです。ゆっくりMovieMakerはデフォルトの音声ヒットレート192kbpsのmp4で出力しました。

本サイトにおいてあるサンプルは、mp3 128k CBR で mp3 変換保存してあります。多少音質は変わるはずですが、大きくずれませんので、音質よりしっかり発音できているかどうかに着目してチェックしてみてください。

最終的な音声ファイルとしての出力は、フリーの VOICEVOX、決して有料ソフトに負けていないと思う出来栄えです。しかし、AITalk®5はテキストを入力して構文解析するまでのタイムラグが短いのに対し、VOICEVOX は一分ごとに解析が入るので少しもたつきます。実際、ファイル作成までのストレスのなさは、有償のAITalk®5に分があるという感じですね。AITalk®5は出力した音声の品質は高いのですが、テスト再生中の音質は大したことないレベルです。

ゆっくりMovieMaker は本来、映像ツールですので、この場で比較してもあまり意味がないかもしれないのですが、霊夢(れいむ)のファンは多いと思いますので、参考として登場させています。の品質は、お聞きの通りですが、現在ではこの音質、しゃべり方がキャラクターとしての地位を獲得していますので、慣れた人にはかえって聞き心地がいいのかもしれません。

音声出力を学習用に使うなら、自分が一番頭に入ってくる音声を採用する必要がありますが、YouTube なら一番ウケる音声を使う方がベストです。有償ソフトが必ずしもベストとは言えないのが難しいところですが、使ってみた感じでは、初心者にもやさしいのはAITalk®5がぶっちぎりだと思います。

AITalk®5の合成音声が気に入らない人も少なからずいるのですが、AITalk®5のコアは、微妙なフレーズ(イントネーション)の調整やスピード調整、音声ファイルの出力部分にでもありますので、合成音声だけを別途他社のものに入れ替えることも可能です。ただ、聞こえのいい音声、特に声のサンプル収集に手間とライセンスがかかったと思われるものは、やはり高額です。AITalk®5のデフォルト音声は、決して悪くないのですが、私のように長く愛用していると少し飽きがくるのも事実です。その時は、多少トーンやピッチを変えて、眠たくならない声に調整してやるなど、ひと手間加えてやるといいと思います。

気になる AITalk®5 の商用利用について

VOICEVOX に関しては商用利用できます。ただし、クレジット表示が必要です。
AITalk®5は、原則商用利用が不可ということになっています。この点が厄介です。
ただ、個人レベルの YouTube 配信へのナレーション挿入程度なら、特にうるさいことは言われません。もちろん、そのチャンネルに数百万人ユーザー登録があったとしても問題ありません。AITalk®5を使用した配信動画を、DVD 等にして販売して収益を受けるところまでやると、何か言われることになると思います。

ただの YouTube 動画配信の場合なら、収益を受けていても個人登録のユーザーなら問題ありません。個人登録をやめて、会社にしてしまうとグレーになります(一応規定上はアウトです)。企業に属していて、個人で勝手に使用して、その企業のための動画配信をしているという場合は、アウトになると思います。

といっても、この手の規定がめんどくさくて手を付られないという人もいるはずですので、商用利用の考え方の原則を抑えておきましょう。
法律的な解釈をすると、メーカーの規定書の文言通りです。例えば、個人で活動している YouTuber が一人で社長と従業員を兼ねる会社を設立して、その名で本ソフトを使用した YouTube 配信で利益を得たらアウトになるはずです。でも、現実はメーカーはそんなことで訴えたりしません。むしろ、ソフトを活用して宣伝してくれてありがとうと言われるはずです。

でも、アウトなケースがあります。例えば、マジメな声優がキャラを作って作り上げた音声を、セクシービデオ系の猥褻音声として利用したり、声優やソフトのイメージ、会社の経営理念を大きく損ねる利用です。これは、個人利用の場合でも、何ら理由をつけられてアウトです。

つまり、販売・制作会社の利益を損ねる行為はアウトということです。新たなソフトの活用法を見出して YouTube で発表した、それが販売促進に繋がり、ソフトの優秀さを証明することになったというようなケースは、契約書の文言がどうであれ、奨励されることが多いという現実があります。このことから、個人レベルで YouTube にナレーションを入れて公開する程度のことは許されます(ただし、製品イメージ・キャラを概してはいけません)。

自分の利用法がアウトかどうか微妙だと思ったら、直接企業に問い合わせるのが無難です。大金を払えない個人が、収益も上がらない同人レベルの活動しかできていないのに、商用ライセンスを結べなどと言われようものなら、ソフト自体が売れませんので自然淘汰されます。ほぼほぼセーフとされるケースが大半です。

まとめ

音声合成ソフトは複数使用するのがベストだといえます。ただし、YouTube 動画などで毎回音声を変えると、視聴者が混乱する可能性があるので、テーマにあった声を一つだけ採用するといいです。

「AITalk®5」はどちらかといえば、マジメ系のナレーションに向いていると思 います。ふざけた感じのテーマにするなら、ゆっくり MovieMaker の方がウケるかもしれません。聞きやすさ、作成効率を考えれば「AITalk®5」の一択ですね。

といても、VOICEVOX はそもそもフリーですので、持っておくに越したことはありません。YouTube 界隈ではこちらのソフトも幅広く皆に愛用されています。三つとも使ってみると、私同様、AITalk®5の出番が多くなると思います。というのも、作業効率がよくちょっとした読み間違えの修正なども、早くできるからです。ゆっくり MovieMakerは慣れている人が多いので、悪いとは思わないですが、YouTuber の方はこれでやると で BAN されるリスクが高いといううわさ話も聞きますので、動画配信者は他のソフトも用意してリスクヘッジしておくといいと思います。

スポンサーリンク