研究者
J-GLOBAL ID:200901078361430252   更新日: 2024年11月06日

柳井 啓司

ヤナイ ケイジ | KEIJI YANAI
所属機関・部署:
職名: 教授
その他の所属(所属・部署名・職名) (1件):
ホームページURL (1件): https://mm.cs.uec.ac.jp/
研究分野 (2件): 知覚情報処理 ,  データベース
研究キーワード (6件): 深層学習による画像生成・変換 ,  深層学習 ,  マルチメディア映像処理 ,  Web画像マイニング ,  一般物体認識 ,  画像・映像認識
競争的資金等の研究課題 (21件):
  • 2022 - 2026 深層学習を用いた能動的な新しい食事管理技術の創出
  • 2022 - 2025 文字を介した視覚的コミュニケーション基盤の創成
  • 2022 - 2024 機能の重ね合せを実現する深層学習におけるタスク融合学習
  • 2021 - 2023 質感と形状の分離による奥深質感画像分析・生成のためのマルチモーダル深層学習モデル 【深奥質感】
  • 2017 - 2022 機械可読時代における文字科学の創成と応用展開 【分担者】
全件表示
論文 (268件):
  • Junwen Chen, Yingcheng Wang, Keiji Yanai. Focusing on what to decode and what to train: SOVDecoding with Specific Target Guided DeNoising and Vision Language Advisor. Proc. of IEEE/CVF Winter Conference on Applications of Computer Vision (WACV). 2025
  • Kota Izumi, Keiji Yanai. WaveFontStyler: Font Style Transfer Based on Sound. Proc. of the International Multimedia Modeling Conference (MMM) (demo). 2025
  • Honghui Yuan, Keiji Yanai. KuzushijiFontDiff: Diffusion Model for Japanese Kuzushiji Font Generation. Proc. of the International Multimedia Modeling Conference (MMM) (demo). 2025
  • Honghui Yuan, Keiji Yanai. SceneTextStyler: Editing Text with Style Transformation. Proc. of the International Multimedia Modeling Conference (MMM) (demo). 2025
  • Hikaru Tanabe, Keiji Yanai. CalorieVoL: Integrating Volumetric Context into Multimodal Large Language Models for Image-based Calorie Estimation. Proc. of the International Multimedia Modeling Conference (MMM). 2025
もっと見る
MISC (38件):
特許 (5件):
  • 画像スタイル変換装置,画像スタイル変換方法及び画像スタイ変換プログラム
  • 線形識別器,大規模一般物体認識装置及び電子計算機
  • 画像ランキング方法,プログラム及び記録媒体並びに画像表示システム
  • 摂取量推定装置,摂取量推定方法及びプログラム
  • 画像処理方法,その方法を実行するプログラム,記憶媒体,撮像機器,画像処理システム
書籍 (8件):
  • IT Text 深層学習
    オーム社 2022
  • レクチャー マルチメディア: 基礎からわかる音・画像・映像の情報処理
    数理工学社 2022
  • 光学辞典
    朝倉書店 2014
  • 総合コミュニケーション科学シリーズユニーク&エキサイティング サイエンス III
    近代科学社 2014
  • Multimedia Information Extraction
    IEEE Computer Society Press 2011
もっと見る
講演・口頭発表等 (240件):
  • StableSeg: Stable Diffusionによるゼロショット領域分割
    (画像の認識・理解シンポジウム (MIRU) 2023)
  • 人物・物体・動作デコーダの分離によるHOI検出
    (電子情報通信学会パターン認識・メディア理解研究会(PRMU) 2023)
  • VQ-VDM: ベクトル量子化変分オートエンコーダと 拡散モデルを用いた動画生成モデル
    (画像の認識・理解シンポジウム (MIRU) 2023)
  • CalorieCam360: 全方位カメラによる複数人同時食事カロリー量推定システム
    (画像の認識・理解シンポジウム (MIRU) 2023)
  • CLIPと微分可能レンダラーを用いたフォントスタイル変換
    (画像の認識・理解シンポジウム (MIRU) 2023)
もっと見る
学歴 (3件):
  • 1997 - 1997 東京大学 大学院工学系研究科 情報工学専攻 博士課程
  • 1995 - 1997 東京大学 大学院工学系研究科 情報工学専攻 修士課程
  • - 1995 東京大学 工学部 計数工学科
学位 (3件):
  • 修士(工学) (東京大学)
  • 博士(工学) (東京大学)
  • Doctor of Engineering (The University of Tokyo)
経歴 (5件):
  • 2015/04 - 電気通信大学 大学院情報理工学研究科 情報学専攻 教授
  • 2010/04 - 2015/03 電気通信大学 大学院情報理工学研究科 総合情報学専攻 准教授
  • 2006/04 - 2010/03 電気通信大学 情報工学科 助教授
  • 1997/10 - 2006/03 電気通信大学 情報工学科 助手
  • 2003/11 - 2004/09 米国アリゾナ大学 コンピュータサイエンス学科 客員研究員
受賞 (27件):
  • 2024/08 - MIRUデモ発表賞 WaveFontStyler: 音に基づくフォントスタイル変換
  • 2023/12 - ACM Multimedia Asia Best Poster Award VQ-VDM: Video Diffusion Models with 3D VQGAN
  • 2023/07 - International Conference on Machine Vision and Applications Best Paper Award at MVA 2023 QAHOI: Query-based Anchors for Human-Object Interaction Detection
  • 2023/07 - 画像の認識・理解シンポジウム (MIRU2023) MIRUインタラクティブ発表賞 CLIPと微分可能レンダラーを用いたフォントスタイル変換
  • 2023/07 - 画像の認識・理解シンポジウム (MIRU2023) MIRU優秀賞 StableSeg: Stable Diffusionによるゼロショット領域分割
全件表示
所属学会 (5件):
ACM ,  IEEE Computer Society ,  人工知能学会 ,  電子情報通信学会 ,  情報処理学会
※ J-GLOBALの研究者情報は、researchmapの登録情報に基づき表示しています。 登録・更新については、こちらをご覧ください。

前のページに戻る