ENGLISH 使い方
文献、特許、研究者などの科学技術情報サイト

共著の研究者

共同発明の研究者

この研究者の研究内容に近い研究者

この研究者の研究内容に近い文献

この研究者の研究内容に近い特許

この研究者の研究内容に近い研究課題

この研究者が著者と推定される文献

この研究者が発明者と推定される特許

研究者
J-GLOBAL ID:201801014603986279   更新日: 2025年02月20日

李 勝

リ シェン | LI Sheng
クリップ
所属機関・部署:
職名: 助教授
ホームページURL (2件): https://halspeech.github.io/index-modern-jp.htmlhttps://halspeech.github.io/index.html
研究分野 (1件): 知覚情報処理
研究キーワード (5件): 大規模な言語モデル (音声、テキスト) ,  セキュリティ対応の音声処理 ,  マルチモーダル音声処理 ,  メディア処理技術を用いた語学学習支援(CALL) ,  音声認識/翻訳
競争的資金等の研究課題 (10件):
  • 2023 - 2028 意図を的確に伝える音声対話翻訳の基盤技術の創出
  • 2023 - 2026 M3OLR: Towards Effective Multilingual, Multimodal and Multitask Oriental Low-resourced Language Speech Recognition
  • 2023 - 2024 自動話者認識における「なりすまし」の探知
  • 2024 - 大規模言語モデル強化
  • 2022 - 2024 Bridging Eurasia from Sea -- Multilingual Speech Recognition for Maritime Silkroad
全件表示
論文 (116件):
  • Jiliang Hu, Zuchao Li, Mengjia Shen, Haojun Ai, Sheng Li, Jun Zhang. Joint Automatic Speech Recognition And Structure Learning For Better Speech Understanding. IEEE-ICASSP. 2025
  • Jun-You Wang, Sheng Li, Li-An Lu, Sydney Chia-Chun Kao, Jyh-Shing Roger Jang. Similarity-based accent recognition with continuous and discrete self-supervised speech representations. IEEE-ICASSP. 2025
  • Chin Yuen Kwok, Sheng Li, Jia Qi Yip, Chenhui Chu, Tatsuya Kawahara, Eng Siong Chng. Extending Whisper for Emotion Prediction Using Word-level Pseudo Labels. IEEE-ICASSP. 2025
  • Hay Mar Soe Naing, Win Pa Pa, Sheng Li. Parallel and Limited Data Voice Conversions on Myanmar Language Speech for Spoofed Detection. Proceedings of the 6th ACM International Conference on Multimedia in Asia Workshops. 2024. 1-5
  • Qingqing Zhang, Lei Luo, Simin Xu, Yongjing Chen, Chuang Li, Sheng Li, Ruili Wang. LaMuCo: Large-Scale Multilingual Conversation Speech Recognition Challenge. Proceedings of the 6th ACM International Conference on Multimedia in Asia Workshops. 2024. 1-3
もっと見る
MISC (20件):
  • Zhengdong Yang, Qianying Liu, Sheng Li, Fei Cheng, Chenhui Chu. Cross-lingual Embedding Clustering for Hierarchical Softmax in Low-Resource Multilingual Speech Recognition. arXiv. 2025
  • Jiliang Hu, Zuchao Li, Mengjia Shen, Haojun Ai, Sheng Li, Jun Zhang. Joint Automatic Speech Recognition And Structure Learning For Better Speech Understanding. arXiv. 2025
  • Yuka Ko, Sheng Li, Chao-Han Huck Yang, Tatsuya Kawahara. Benchmarking Japanese Speech Recognition on ASR-LLM Setups with Multi-Pass Augmented Generative Error Correction. arXiv. 2024
  • Lele Zheng, Yang Cao, Renhe Jiang, Kenjiro Taura, Yulong Shen, Sheng Li, Masatoshi Yoshikawa. Extracting Spatiotemporal Data from Gradients with Large Language Models. arXiv. 2024
  • Chao Tan, Sheng Li, Yang Cao, Zhao Ren, Tanja Schultz. Investigating Effective Speaker Property Privacy Protection in Federated Learning for Speech Emotion Recognition. arXiv. 2024
もっと見る
特許 (7件):
  • 推論器および推論器の学習方法
  • 推論器、推論プログラムおよび学習方法
  • 言語識別モデルの訓練方法及び装置、並びにそのためのコンピュータプログラム
  • 識別器、学習済モデル、学習方法
  • 音声認識システム、音声認識方法、学習済モデル
もっと見る
書籍 (4件):
  • Voices of the Himalayas: Investigation of Speech Recognition Technology for the Tibetan Language
    2023 ISBN:9784904020289
  • Bridging Eurasia: Multilingual Speech Recognition for Silkroad
    2023 ISBN:9784904020296
  • Phantom in the Opera: The Vulnerabilities of Speech-based Artificial Intelligence Systems
    2022 ISBN:9784904020265
  • Automatic speech recognition: Speech-to-Speech Translation
    Springer Singapore 2020
講演・口頭発表等 (58件):
  • 大規模言語モデルの統合による音声認識システムの改善
    (NICT Open House 2024 2024)
  • Combining Large Language Model with Speech Recognition System in Low-resource Settings
    (言語処理学会第30回年次大会 2024)
  • Investigating effective methods for combining large language model with speech recognition system
    (日本音響学会第151回(2024年春季)研究発表会 2024)
  • Hierarchical Softmax for End-to-End Low-resource Multilingual Speech Recognition
    (ICT-innovation 2023 (Kyoto Univ.) 2024)
  • Self-Supervised Learning MOS Prediction with Listener Enhancement
    (VoiceMOS mini workshop 2023)
もっと見る
Works (8件):
  • HSoftmax: Hierachical Softmax (https://github.com/Derek-Gong/hsoftmax/)
    Zhuo Gong, Qianying Liu, Sheng Li, Zhengdong Yang, Yuhang Yang 2020 -
  • Julius for speech foundation models
  • very deep residual time-delay neural network (TDNN) with LFMMI objective implemented with MS-CNTK
  • online speech recognition module for Erica the human robot
  • Julius decoder with EESEN CTC acoustic model
もっと見る
学歴 (3件):
  • 2012 - 2016 京都大学 大学院 情報学研究科知能情報学専攻博士後期課程
  • 2007 - 2009 南京大学 中国科学院,香港中文大学,南京大学連携項目課程 修士
  • 2002 - 2006 南京大学 工学院 計算機科学コース (理学)
学位 (1件):
  • 情報学博士 (京都大学)
経歴 (9件):
  • 2025/03 - 現在 東京科学大学 助教授 (非特任/非客員)
  • 2020 - 2025/02 国立研究開発法人情報通信研究機構 (NICT) 先進的音声技術研究室(ASTL) テニュアトラック 研究員
  • 2024/02 - 2024/03 南洋理工大学 visiting researcher
  • 2021/12 - 2023/03 京都大学大学院 情報学研究科 修士課程アドバイザー
  • 2019/04 - 2019/05 Oxford University Computer science department visiting researcher
全件表示
委員歴 (14件):
  • 2025/01 - 2027/01 IEEE Signal Processing Society (SPS) Applied Signal Processing Systems Technical Committee (ASPS TC)
  • - 2026 APSIPA Speech, Language, and Audio (SLA) Technical Committee (till 2026)
  • 2024/06 - 2024/12 Publicity Chair of ACM Multimedia Asia 2024
  • 2024/12 - Co-organizing ACM Multimedia Asia 2024 workshop: Multimodal, Multilingual and Multitask Modeling Technologies for Oriental Languages (M3Oriental) Co-organizer
  • 2024/07 - Session Chair of DASFAA2024
全件表示
受賞 (23件):
  • 2024/12 - SLT2024 grand challenge LLM GER task1: speech recognition error correction using LLM
  • 2023/12 - ICASSP2024 ICMC-ASR (In-Car Multi-Channel Automatic Speech Recognition) Challenge top2 in one track
  • 2023/12 - 1st place in one track in ASRU2023 special session: VoiceMOS challenge
  • 2023/05 - IEEE signal processing society IEEE-SPS grant for IEEE-ICASSP2023 oral presentation (Co-supervised PhD student Qianying Liu)
  • 2022 - 1st place in 6 indexes (total 16) of Main/OOD tracks in INTERSPEECH2022 special session: VoiceMOS challenge
全件表示
所属学会 (7件):
APNNS (Asia Pacific Neural Network Society) ,  APSIPA (Asia Pacific Signal and Information Processing Association) ,  SIG-CSLP (Chinese Spoken Language Processing) ,  ASJ (日本音響学会) ,  ISCA (International Speech Communication Association) ,  IEEE/IEEE-SPS ,  ACM (Association for Computing Machinery)
※ J-GLOBALの研究者情報は、researchmapの登録情報に基づき表示しています。 登録・更新については、こちらをご覧ください。

前のページに戻る