ニュース番組の収録音声を利用した波形接続型音声合成システム

世木寛之; 田高礼子; 清山信正; 都木徹

文献

J-GLOBAL ID：200902285510028615 整理番号：09A0203748

ニュース番組の収録音声を利用した波形接続型音声合成システム

Concatenative Speech Synthesis System Using Recordings of Japanese Broadcast News Programs as a Speech Database

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=09A0203748&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=09A0203748&from=J-GLOBAL&jstjournalNo=Z0778B") }}

著者 (4件)： , , ,
資料名：
巻： 50 号： 2 ページ： 575-586 発行年： 2009年02月15日
JST資料番号： Z0778B ISSN： 1882-7837 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

大規模な音声データベースから音声データを選択して接続する波形接続型音声合成が提案されている。この音声合成方式で利用される大規模音声データベースは,音韻バランスなどを考慮して選定された文章を,音声合成に適した話速やスタイルで読み上げることで作成されることが多い。一方,放送局では過去に放送された番組が大量に保存されているため,これらを音声データベースとして利用することが考えられる,本研究では,ニュース番組の収録音声を,波形接続型音声合成システムの音声データベースとして利用することを試みた。高い頻度で音声データベースに存在する音素列を,前後の音素環境を考慮して抽出した“音素環境依存音素列”を探索単位として合成音を作成し,5段階のオピニオン評価実験を行った結果,MOSは4.01となり,「不自然な部分はあるが気にならない」という自然性を持つ合成音が得られた。特に,全体の39.8%が5の「自然である」と評価され,自然音声と変わらない品質の合成音がかなりの頻度で作成されていることが分かった。次に,目標スコアを用いた場合と,用いない場合の合成音とを比較したところ,MOSの差は0.18となり,音声データベースの発話内容と合成する文が類似している場合には,必ずしも韻律予測せず目標スコアを考慮しなくても,自然性の高い合成音を作成できる可能性が示された。(著者抄録)

, , , , , , , , ,
, , , ,

音声処理 , 情報加工一般

引用文献 (25件)：

世木寛之, 清山信正, 田高礼子ほか: 高品質な株価音声合成装置の開発とデジタルラジオ放送での試験運用, 映像情報メディア学会誌, Vol.62, No.1, pp. 69-76(2008).
道家守, 林正樹, 牧野英二: TVMLを用いた番組情報からのニュース番組自動生成, 映像情報メディア学会誌, Vol.54, No.7, pp. 1097-1103(2003).
Matsumura, K., Kai, K., Hamada, H. and Yagi, N.: Transforming Data Broadcast Contents to Fit Different User Interfaces Generating a Readout Service for Mobile DTV Receiver, Proc.7th International Conference on Human ComputerInteraction with Mobile Devices and Services (MobileHCI’05), pp. 323-324(2005).
村上仁一, 水澤紀子, 東田正信: 音節波形接続による単語音声合成, 電子情報通信学会論文誌 (D-II), Vol. J85-D-II, No.7, pp. 1157-1165(2002).
Black, A. and Campbell, N.: Optimizing Selection of Units from Speech Database for Concatenative Synthesis, Proc. EUROSPEECH, Vol.1, pp. 581-584(1995).

, , , , ,

前のページに戻る