Pat
J-GLOBAL ID:201803012478580642

単語分割装置、方法、及びプログラム

Inventor:
Applicant, Patent owner:
Agent (1): 特許業務法人太陽国際特許事務所
Gazette classification:特許公報
Application number (International application number):2014142404
Publication number (International publication number):2016018489
Patent number:6269953
Application date: Jul. 10, 2014
Publication date: Feb. 01, 2016
Claim (excerpt):
【請求項1】 対象分野の文字列の集合である生コーパスに含まれる文字列に基づいて部分文字列毎に計算された、前記部分文字列の前後に接続される文字の異なり数又は曖昧性に関する統計量に基づいて、前記生コーパスに含まれる文字列の各々に対して、単語分割する位置を推定し、文字間の各々に単語分割する位置を示すラベルを付与する分割位置推定部と、 前記対象分野とは異なる元分野の文字列の集合であって、かつ、文字間の各々に単語分割する位置を示すラベル及び単語分割しない位置を示すラベルが予め付与された単語分割コーパスに含まれる文字列の各々に対して、単語分割する位置を示すラベルが付与された文字間の各々についての素性、及び単語分割しない位置を示すラベルが付与された文字間の各々についての素性を抽出し、前記生コーパスに含まれる文字列の各々に対して、単語分割する位置を示すラベルが付与された文字間の各々についての素性を抽出する学習素性抽出部と、 前記学習素性抽出部により抽出した、単語分割する位置を示すラベルが付与された文字間の各々についての素性、及び単語分割しない位置を示すラベルが付与された文字間の各々についての素性に基づいて、前記対象分野の文字列について単語分割する位置を判定するための単語分割モデルを学習するモデル学習部と、 入力された前記対象分野の文字列に含まれる文字間の各々についての素性を抽出する素性抽出部と、 前記素性抽出部により抽出した前記文字間の各々についての素性と、前記モデル学習部により学習された前記単語分割モデルとに基づいて、前記入力された前記対象分野の文字列に含まれる文字間の各々から、単語分割する位置を判定する二値分類部と、 を含む、単語分割装置。
IPC (1):
G06F 17/27 ( 200 6.01)
FI (1):
G06F 17/27 670
Patent cited by the Patent:
Cited by examiner (3)
Article cited by the Patent:
Return to Previous Page