画像キャプショニングは画像そのものよりも多くを語る

有働帆乃璃; 越仲孝文

文献

J-GLOBAL ID：202302281356290460 整理番号：23A3109346

画像キャプショニングは画像そのものよりも多くを語る

Image Captioners Tell More Than Images Given to Them

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
このテーマを更に深掘りする（JDreamⅢへ） {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=23A3109346&from=J-GLOBAL&jstjournalNo=U1701A") }}

著者 (2件)： ,
資料名：
巻： 37th ページ： ROMBUNNO.4A3-GS-6-04(J-STAGE) 発行年： 2023年
JST資料番号： U1701A ISSN： 2758-7347 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

画像から説明文を生成する画像キャプショニング技術(image-to-text)は,深層学習が登場して以降急速に発展している.この画像キャプショニングによって生成される説明文において,元の画像がもつ情報はどの程度維持されるだろうか?この問いに答えるため,画像を一切見ずに説明文のみから画像を分類する実験を行い,標準的なCNNベースの画像分類との精度比較を行う.災害画像分類タスク,CrisisNLPにおいていくつかの画像キャプショニングモデルを評価し,説明文による分類器が時にCNNベースの分類器を超える精度を達成できることを示す.さらに,CNNベースの分類器と説明文による分類器を統合することでさらなる精度向上が得られることを示す.(著者抄録)

, , , , , , , ,
, , , ,

人工知能 , 図形・画像処理一般 , その他の情報処理

前のページに戻る