END-TO-END MULTIMODAL SPEECH RECOGNITION-MedSci.cn

END-TO-END MULTIMODAL SPEECH RECOGNITION

Palaskar, S; Sanabria, R; Metze, F

Palaskar, S (reprint author), Carnegie Mellon Univ, Pittsburgh, PA 15213 USA.

2018 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2018; (): 5774

Abstract

Transcription or sub-titling of open-domain videos is still a challenging domain for Automatic Speech Recognition (ASR) due to the data's challenging ......

Full Text Link

Links

期刊讨论 | 中国SCI论文 | 期刊主页 | 投稿经验 | 杂志官网 | 投稿链接 | 作者需知 | PMC链接 | Pubmed全文检索

科室
- - 订阅+
  - 更多科室
工具
服务