音声信号処理の世界  Myアルゴリズムで聞き分け率アップ!ボイス制御マシンにも使える!?ラズベリー・パイでトライ!音声認識  お試しプログラムも用意!第1回  最初のステップ!音声の波形表示&解析

安藤章悟; 小黒玲

文献

J-GLOBAL ID：201302292079435614 整理番号：13A1502577

音声信号処理の世界 Myアルゴリズムで聞き分け率アップ!ボイス制御マシンにも使える!?ラズベリー・パイでトライ!音声認識お試しプログラムも用意!第1回最初のステップ!音声の波形表示&解析

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=13A1502577&from=J-GLOBAL&jstjournalNo=L0339A") }}

著者 (2件)： ,
資料名：
巻： 39 号： 11 ページ： 129-136 発行年： 2013年11月01日
JST資料番号： L0339A ISSN： 0387-9569 資料種別：逐次刊行物 (A)
記事区分：解説発行国：日本 (JPN) 言語：日本語 (JA)

標題連載論文では人の声をテキストに変換する音声認識を利用する上で理解すべき技術を解説し,Rasberry Piを用いてそれらを体感することを目指している。本論文では,1)音響分析,2)音声認識処理によって音響的情報と言語情報を用い,入力音声からテキストを出力する音声認識技術を概説した。特に,1)はマイクからの入力音声をディジタル化して人間がしゃべったと思われる区間を切り出し,そのデータを20~30ミリ秒の小区間(窓)ごとに切り取って窓関数をかける。横軸が時間,縦軸が音圧に対応する音声波形からは音の高さはわかるが何をしゃべったのかはわからないので,音声編集ソフトウェアAudacityを用いてフーリエ変換によって横軸が時間,縦軸が周波数,色の濃さが音の大きさを表すスペクトログラムを示した。また,音声波形を離散フーリエ変換によって横軸が周波数,縦軸が音の強さのスペクトラムに変換し,対数をとって逆フーリエ変換することで音声認識に必要なケプストラム(特徴量)を抽出できることを説明した。スペクトログラムでは発声の傾向がわかるのに対し,スペクトルではどの周波数で共鳴しているのかによって口の形がわかり,何をしゃべっているのかがわかるので声を文字に変換でできることを解説した。

, , , , , , , , ,
, ,

パターン認識 , 音響信号処理 , 音声処理

, , , , , , , , ,

前のページに戻る

音声信号処理の世界 Myアルゴリズムで聞き分け率アップ!ボイス制御マシンにも使える!?ラズベリー・パイでトライ!音声認識 お試しプログラムも用意!第1回 最初のステップ!音声の波形表示&解析

音声信号処理の世界 Myアルゴリズムで聞き分け率アップ!ボイス制御マシンにも使える!?ラズベリー・パイでトライ!音声認識お試しプログラムも用意!第1回最初のステップ!音声の波形表示&解析