« 0023 キャラクターモデルの可能性 | トップページ | 0025 メイドロイド™の、脚の原型 »

2008年3月15日 (土)

0024 RCB-3音声ユニットについて

 現在、メイドロボ・メイドロイド™の音声ユニットには、京商株式会社のRCB-3音声ユニット(MANOI/DO3)という製品を使用しております。

20080315_02

 先日のワンダーフェスティバルでメイドロイドを展示した際にも、動作と同時に、この音声ユニットでの発声テストも行っておりました。
 仮組みという事で、回路は頸部の後ろにワイヤーで固定し、スピーカーはメイド服の胸元に隠しております。

20080315_05

 メイドロイドの発声する音声でございますが、ワンダーフェスティバルでの展示の際には、間に合わせとして以前発売されていたデスクトップアクセサリー『デスクトップのメイドさん』シリーズのシステム音声を利用いたしました。

20080315_03

 1巻は中川亜紀子お嬢様が演じられました“メイファン”、2巻は今井由香お嬢様が演じられました“シンディ”、3巻は冬馬由美お嬢様が演じられました“アニエス”と、三種類のシステム音声が収録されており、更に続刊もございます。
 今はこれらの製品は絶版で手に入り難くこざいますが、『初音ミク』や、『鏡音リン・レン』などの、VOCALOIDで自作した音声をSDメモリーカードに記録する事で、任意の台詞をしゃべらせる事も難しくないのではと存じます。

 このRCB-3音声ユニット(MANOI/DO3)と言う製品は、近藤科学社製のコントロールボードRCB-3から制御できる音声ユニットでございまして、SDメモリーカードに録音いたしました50通りのWAV形式の音声を再生する事ができるものでございます。
 使用電圧は6V~12Vと幅広く、ブックマッチ程のサイズで、重さもスピーカー込みで30gしかなく、使い方もサーボモーターをコントロールするのと同様のプログラムで扱えますので、非常に簡単に制御できるようになっております。
 しかし残念な事に、使用説明書が少々煩雑でございまして、そのために、せっかくのシンプルな機構であるにも関わらず、初めて使う時には理解にやや手間を要してしまいます。

 簡単に申しますとこのユニットは、目には見えませんが『000番~050番までの51接点のロータリースイッチがあり、それをサーボモーターで回すようなもの』、と思っていただければ良いかと思います。
 そして、サーボモーターでロータリースイッチをカチカチと回してやりますと、その番号に録音してある音声が再生されるわけでございます。
 あらかじめ、000番にノンモン(無音)と、001番から050番に色々な台詞を録音しておきます。
 そして、ロータリースイッチを任意の角度に回すようサーボモーターに指示してやる事で、任意の番号の音声を選んで発声させる事ができるわけでございます。
 図にいたしますと、このような感じでございます。

20080315_01

 途中で音声を止めたい時は、000番の角度にサーボモーターを回してやりますと「無音を発声する」を呼び出す事で、音を停止いたします。

 どの角度値で何番の音声が発声するかは、製品によって個体差がございますので、あらかじめ自分で計って調べておく必要がございます。
 また、電気的なバックラッシがあるようで、順転と逆転では、音声が呼び出される角度値がズレる事がございますので、それも計っておく必要がございます。
 もっとも、呼び出しの角度値には10stepほどの幅がございますので、常に、順転と逆転で呼出される角度の中間値を使っておけば、問題はないようでございます。
 コントロールボード用ソフトウエア『HeartToHeart』を使い、角度の値を1つづつ上げて行き、音声が再生された値を001番から050番まで一通り記録します。
 そして次に、反対に1つづつ下げながら、同様に001番から050番までが再び再生された値を記録します。
 その昇順と降順の値の差によって、バックラッシによる差分を割り出す事ができます。

 また、例えば『HeartToHeart』での使用ですと、[speed]の値が大きいと、ダイヤルをゆっくり回っているのと同じ事になり、直前に呼び出した番号の音声から、次に呼び出した番号の音声までが、次々と連続して発声してしまいます。
 ですのでプログラムの際は、ロボットの動作とは別に、音声の呼出しだけの別の[POS]を使い、小さな[speed]値で瞬時に任意の音声を呼び出してやる必要がございます。
 しかし、[speed]値を1で組みますと、あまりに早すぎて処理がおいつかない事がございますので、2~5程度が良いかと存じます。

 ただ、このRCB-3音声ユニット(MANOI/DO3)には難点もございます。
 ノーマルのままでは音量があまり大きくないため、そのままでは広い会場では声が分散してしまって、ほとんど聞き取る事はできません。
 あくまでも家庭内などのあるていど静かな限定された部屋での使用に留まります。
 また、使用できる音声ファイルのサンプリングレートが11.025kHzとかなり低めですので、素材の段階でかなり音質を劣化させてしまう事になり、どんなにスピーカーやアンプを工夫しても音質は上がらないという点がございます。
 人間の声を、単純な周波数だけで捉えますとサンプリング周波数は11.025kHzあれぱ足りるように思えますが、音声は複雑な波形をしておりまして、例え16bitの解像度がありましても11.025kHzでは変調度が足りず、台詞によっては滑舌が悪く聞こえてしまう事もございます。
 また、高音が著しくカットされてしまいますので、破裂音や摩擦音などの発音も記録しにくくなり、全体に音が丸まった、古いAMラジオか黒電話的な音質に下がってしまいます。
 そして、発声の前や後に、ノイズ音が混じる事がしばしばございます。

 このあたりは製品の仕様との事ですのでどうする事もできませんが、この価格と、この利便性から来るコストパフォーマンスの高さに関しては、とても面白い製品ではないかと存じます。
 効果音やインフォメーションなど、様々な用途に手軽に使えるかと存じます。

|