- 2010-07-14 (水) 1:08
- Mumble 1.2
Microsoft Speech Platform 10.1という音声合成のためのライブラリが先月に公開されていたようです。
このSpeech Platformの大きな特徴は日本語をはじめとする多くの音声合成エンジンが無償で公開されているという点です。しかも品質が比較的高いのです。
音声合成というのはテキストを入力として音声合成をして読み上げるため機能です。テキスト読み上げをしたいソフトウェアなどから呼び出されて利用されます。Windows 7/VistaにはMicrosoft SpeechAPI 5(SAPI5)という音声合成エンジンがデフォルトでインストールされており、多くのソフトウェアが、この機能を利用してテキストの読み上げをしています。ただ、Windowsにデフォルトで入っているSAPI5対応の音声合成エンジンは英語版のみです。SAPI5対応の日本語合成エンジンが、ほとんど有償のものしかないため日本ではあまり一般的ではありません。SAPIを利用しない独立した音声合成エンジンが無償で公開されているということもあり、棒読みちゃんやSofttalkのようにそれらを利用した音声合成ソフトがポピュラーです。
こんな良いものが公開されたとなってはすぐにでも飛びつきたいところなんですが、このSpeech Platformは一般的にSAPI5とほとんど互換性がないらしくSAPI5対応のアプリでは利用できないようです。
私が翻訳をしているボイスチャットソフトウェア『Mumble』、最近記事で取り上げた音声合成ソフト『棒読みちゃん』なんかも、このSAPI5による音声合成に対応していますが、このSpeech Platformは使えないようです。
ただ、実質的にはSAPI5と大差ないらしく、SAPI5対応のアプリをSpeech Platform に対応させるのはさほど難しくないようです。
Mumbleの方は、Speech Platform のライブラリを使って再コンパイルすることで簡単に対応できました。ですので、棒読みちゃんのほうも作者さんしだいですぐに対応してくれるかもしれません。
今のところ Speech Platformに対応しているアプリケーションはあまりないようです。私の知る限りだとMicrosoft Office 2010 製品のWordやPowerPointで、このSpeechPlatformを使ってのテキスト読み上げができるようです。
導入方法
導入するにはRuntimeと各言語のパッケージの2種類をインストールする必要があります。
Microsoft Speech Platform – Server Runtime (Version 10.1)
次の2種類があるので64bit版のWindowsを使っている人はx64を32bit版はx86の方を落としてインストールしてください。
- Runtime\x64\SpeechPlatformRuntime.msi
- Runtime\x86\SpeechPlatformRuntime.msi
次に各言語パッケージをインストールします。
Microsoft Speech Platform – Server Runtime Languages 10.1
ページの中ほどに
- LangPacks\MSSpeech_TTS_ja-JP_Haruka.msi
というのがあるので、それをダウンロードしてインストールしましょう。
LangPacks\MSSpeech_SR_ja-JP_TELE.msi は、音声合成ではなく音声認識のためのものなので間違えないようにしましょう。
ファイル名から察することが出来た人も、いると思いますが、この音声合成エンジンは Haruka というようです。
導入自体はこの2つをインストールするだけで完了です。
対応アプリケーションの設定
Office 2010
次のサイトが詳しいので確認してください。
テストプログラム
haruの作ったテストプログラムです。
機能皆無ですが、音質を確認する程度には良いかと。
Mumble 1.2.2
Mumble 1.2.2 を Microsoft Speech Platform 10.1 に対応させて見ました。
そのままでは動きません。「証明書インストール方法」を参照してください。
- Newer: TeamSpeak3 Client beta23 & Server beta26 リリース
- Older: ちょっとした気の迷いで
コメント:0
トラックバック:0
- このエントリーのトラックバックURL
- http://www.arcenserv.info/archives/3917/trackback/
- Listed below are links to weblogs that reference
- Microsoft Speech Platform from 死者のページ








