抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,企業などの組織で作成・管理される電子文書やメールの量の増加に伴って,高速・高精度なテキスト検索技術の重要性が増している。テキスト検索技術は,文書やメールの検索システムのほか,情報漏洩(ろうえい)防止のための個人情報・機密情報検出など,様々な応用が可能である。従来のテキスト検索技術では,実時間処理のための文字列照合の高速化と条件設定の容易化,及び蓄積処理時の高速で漏れのない全文検索が課題であった。この課題に対して,次のテキスト検索技術を開発した。(1)高速文字列照合技術sDFA(size-reduced Deterministic Finite Automaton)。大規模検索式でも約1億文字/秒の高速照合(他社比3万~20万倍)の性能を実現。(2)学習型フィルタSSC(String-based Statistical Classifier)。サンプルの自動学習によって条件設定を容易化。(3)テキストフィルタCID(Combined Information Detector)。sDFAとSSCの併用によって条件設定が容易で高精度な分類を実現(再現率99.9%,適合率98.7%)。(4)高速全文検索エンジンFTS(Full Text Search)。1テラバイトのメールを1秒で高速に検索。これらの技術の応用例として,パソコン内の文書ファイルの内容を検査し,個人情報を自動検出する三菱スペース・ソフトウェア(株)(MSS)の個人情報検出ツール“すみずみ君”と,機密情報を自動検出する“機密文書管理システム”を開発した。(著者抄録)