特許
J-GLOBAL ID:202003017612820310
音声を要約するための方法、コンピュータ・プログラムおよびコンピュータ・システム
発明者:
,
,
,
出願人/特許権者:
代理人 (2件):
上野 剛史
, 太佐 種一
公報種別:特許公報
出願番号(国際出願番号):特願2017-547110
特許番号:特許第6714607号
出願日: 2016年02月03日
請求項(抜粋):
【請求項1】 コンピュータにより音声を要約するための方法であって、
オーディオ成分およびビデオ成分を含む、ビデオ会議に対応するデータを受信するステップと、
前記ビデオ成分に含まれる第1の参加者の1つまたは複数の画像を1つまたは複数のテンプレート画像と比較することに基づいて、前記第1の参加者が話していると判定するステップと、
前記オーディオ成分を活用することによって、前記第1の参加者の音声波形の1つまたは複数の固有のパラメータを詳述する情報を含む、前記第1の参加者の声紋を判定するステップと、
前記判定するステップで判定した前記第1の参加者の声紋を前記第1の参加者の前記1つまたは複数の画像の少なくとも1つと関連付けるステップと、
前記判定するステップで判定した前記第1の参加者の声紋に基づいて前記第1の参加者によって話された内容内の1つまたは複数のキーポイントを判定するステップと、
前記判定された1又は複数のキーポイントのうち最も新しい1又は複数のキーポイントを含むオーバーレイを、前記ビデオ成分に含まれる前記第1の参加者の近傍に重ねて表示するステップと、
前記オーバーレイに対するユーザ入力を受け付けるステップと、
前記ユーザ入力を受け付けたことに応じて、前記判定された1又は複数のキーポイントのうち、前記最も新しい1又は複数のキーポイント以外の1又は複数のキーポイントをさらに含むように前記オーバーレイを拡大して表示するステップと
を含む方法。
IPC (3件):
G10L 15/10 ( 200 6.01)
, G10L 17/00 ( 201 3.01)
, G06T 7/00 ( 201 7.01)
FI (5件):
G10L 15/10 500 T
, G10L 17/00 200 C
, G10L 17/00 400
, G06T 7/00 300 D
, G06T 7/00 660 A
引用特許:
前のページに戻る