文献
J-GLOBAL ID:202002231622852541   整理番号:20A0113509

近代書籍における低出現頻度文字種の獲得

著者 (5件):
資料名:
巻: 2019  号: MPS-126  ページ: Vol.2019-MPS-126,No.6,1-6 (WEB ONLY)  発行年: 2019年12月04日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,近代書籍における低出現頻度文字種を獲得する手法を提案する.国立国会図書館で公開されている近代書籍を対象にしたOCRは学習データが少ないため,認識率は十分でない.そこで,本稿では文字種の分野・領域をドメインと定義し,近代書籍における低出現頻度文字種が頻出する特定のドメインから,近代書籍用OCRの認識率向上に必要な低出現頻度文字種を獲得する手法を提案する.まず初めに,学習データの収集対象である青空文庫の書籍の文字の出現頻度を調べ,低出現頻度文字種獲得の難易度の調査を行う.そして,分野の違う書籍として新潟県連合産婆会会報を選択し,近代書籍における低出現頻度文字種が頻出しているかを確認する.次に,青空文庫との文字の出現頻度を比較する実験を行い,提案した手法の有用性を確認する.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
引用文献 (10件):
  • 国立国会図書館:http://www.ndl.go.jp/ (参照:2019/11/05)
  • 国立国会図書館デジタルコレクション:http://kindai.ndl.go.jp/ (参照:2019/11/05)
  • Fujimoto,K.,Ishikawa,Y.,Takata,M. and Joe,K.: Early-Modern Printed Character Recognition using Ensemble Learning,Processing of The 2017 International Conference on Parallel and Distributed Processing Technologies and Applications,Vol.I,pp.288-294(2017).
  • Yasunami,S.,Takemoto,Y.,Ishikawa,Y.,Takata,M.and Joe, K.:Applying CNNs to Early-Modern Printed Japanese Character Recognition,Proceedings of The 2019 International Conference on Parallel and Distributed Processing Technologies and Applications.
  • 日本工業標準調査会:http://www.jisc.go.jp/index.html (参照:2019/11/05)
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る