特許
J-GLOBAL ID:202003017612820310

音声を要約するための方法、コンピュータ・プログラムおよびコンピュータ・システム

発明者:
出願人/特許権者:
代理人 (2件): 上野 剛史 ,  太佐 種一
公報種別:特許公報
出願番号(国際出願番号):特願2017-547110
特許番号:特許第6714607号
出願日: 2016年02月03日
請求項(抜粋):
【請求項1】 コンピュータにより音声を要約するための方法であって、 オーディオ成分およびビデオ成分を含む、ビデオ会議に対応するデータを受信するステップと、 前記ビデオ成分に含まれる第1の参加者の1つまたは複数の画像を1つまたは複数のテンプレート画像と比較することに基づいて、前記第1の参加者が話していると判定するステップと、 前記オーディオ成分を活用することによって、前記第1の参加者の音声波形の1つまたは複数の固有のパラメータを詳述する情報を含む、前記第1の参加者の声紋を判定するステップと、 前記判定するステップで判定した前記第1の参加者の声紋を前記第1の参加者の前記1つまたは複数の画像の少なくとも1つと関連付けるステップと、 前記判定するステップで判定した前記第1の参加者の声紋に基づいて前記第1の参加者によって話された内容内の1つまたは複数のキーポイントを判定するステップと、 前記判定された1又は複数のキーポイントのうち最も新しい1又は複数のキーポイントを含むオーバーレイを、前記ビデオ成分に含まれる前記第1の参加者の近傍に重ねて表示するステップと、 前記オーバーレイに対するユーザ入力を受け付けるステップと、 前記ユーザ入力を受け付けたことに応じて、前記判定された1又は複数のキーポイントのうち、前記最も新しい1又は複数のキーポイント以外の1又は複数のキーポイントをさらに含むように前記オーバーレイを拡大して表示するステップと を含む方法。
IPC (3件):
G10L 15/10 ( 200 6.01) ,  G10L 17/00 ( 201 3.01) ,  G06T 7/00 ( 201 7.01)
FI (5件):
G10L 15/10 500 T ,  G10L 17/00 200 C ,  G10L 17/00 400 ,  G06T 7/00 300 D ,  G06T 7/00 660 A
引用特許:
審査官引用 (6件)
全件表示

前のページに戻る