文献
J-GLOBAL ID:201002251336712900   整理番号:10A0014377

テキスト検索技術と個人情報・機密情報検出

著者 (4件):
資料名:
巻: 83  号: 12  ページ: 717-720  発行年: 2009年12月25日 
JST資料番号: F0198A  ISSN: 0369-2302  CODEN: MTDNAF  資料種別: 逐次刊行物 (A)
記事区分: 解説  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,企業などの組織で作成・管理される電子文書やメールの量の増加に伴って,高速・高精度なテキスト検索技術の重要性が増している。テキスト検索技術は,文書やメールの検索システムのほか,情報漏洩(ろうえい)防止のための個人情報・機密情報検出など,様々な応用が可能である。従来のテキスト検索技術では,実時間処理のための文字列照合の高速化と条件設定の容易化,及び蓄積処理時の高速で漏れのない全文検索が課題であった。この課題に対して,次のテキスト検索技術を開発した。(1)高速文字列照合技術sDFA(size-reduced Deterministic Finite Automaton)。大規模検索式でも約1億文字/秒の高速照合(他社比3万~20万倍)の性能を実現。(2)学習型フィルタSSC(String-based Statistical Classifier)。サンプルの自動学習によって条件設定を容易化。(3)テキストフィルタCID(Combined Information Detector)。sDFAとSSCの併用によって条件設定が容易で高精度な分類を実現(再現率99.9%,適合率98.7%)。(4)高速全文検索エンジンFTS(Full Text Search)。1テラバイトのメールを1秒で高速に検索。これらの技術の応用例として,パソコン内の文書ファイルの内容を検査し,個人情報を自動検出する三菱スペース・ソフトウェア(株)(MSS)の個人情報検出ツール“すみずみ君”と,機密情報を自動検出する“機密文書管理システム”を開発した。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
情報検索一般 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る