文献
J-GLOBAL ID:202002258234209560   整理番号:20A1071507

Word文書ファイルの個別入力データ抽出法の提案

A proposal of individual input data extraction method in Word document file
著者 (4件):
資料名:
巻: 119  号: 468(ET2019 76-105)(Web)  ページ: 163-168 (WEB ONLY)  発行年: 2020年02月29日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本研究では,Microsoft Word文書ファイルを対象として,その書式構造を決めるテンプレートの情報を用いて,文書の個別入力データを自動抽出する方法の提案を行う.その際,事前にテンプレートが得られない場合に,テンプレートの自動生成を行う.ここでは,文書ファイルの内容を単語単位に分割し,その出現回数が総ファイル数と一致するものをテンプレートとしている.本研究の評価として,4種類のテスト用文書ファイル群に対して個別入力データの抽出実験を行い,本提案の有効性を検証する.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  人工知能 
引用文献 (13件):
  • WordprocessingMLドキュメントの構造 (Open XML SDK), https://docs.microsoft.com/ja-jp/office/openxml/structure-of-a-wordprocessingml-document.
  • Depth-first Search, https://en.wikipedia.org/wiki/Depthfirst/_search.
  • Apache Lucene, https://lucene.apache.org.
  • Kuromoji, https://www.atilika.org/.
  • mecab-ipadic-NEologd : Neologism dictionary for MeCab, https://github.com/neologd/mecab-ipadic-neologd.
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る