社会实践> 项目分类> 2019年科研实训——深度学习与语音识别系统
2019年科研实训——深度学习与语音识别系统
项目类别:理工科实习科研
招生名额:20人
适合群体:大学生
活动时间:常年招生
立即报名
(报名前还有疑问? 欢迎致电客服:010-57952000)

项目地点:

北京

项目目的:

本项目通过导师面对面指导学生完整参与一个科研实训项目,激发学生对人工智能和语音识别技术的科研兴趣,培养学生参与科研项目的基本素质和实践能力。

项目费用:

点击咨询>>

  一、项目简介

  语音是人与机器最自然的交互方式之一,被普遍视为最有可能成为下一代信息和服务的入口。语音识别是人工智能感知的重要组成部分,是目前最接近实用突破的研究方向。

  以前的语音识别系统主要是基于GMM-HMM模型,2010年DNN-HMM模型的提出极大地提高了语音识别系统的性能,自此,深度学习模型逐渐成为语音识别声学建模的主流方法。尽管 DNN-HMM 开启了语音识别的新篇章。但DNN-HMM 的流程依然非常复杂,需要丰富的语音语言知识,语音识别的技术门槛依然较高。端到端的语音识别系统旨在简化语音识别的处理流程,直接构建一个从声学特征到文本的序列映射模型。

  目前,主流的端到端的语音识别系统大多是基于深度学习模型,主要包括基于CTC的模型和基Attention的模型。在大规模数据的条件下,端到端的语音识别已经取得了媲美DNN-HMM框架的性能,但依然面临着泛化性能差的问题。探索更好的建模单元和在训练阶段引入更多语音语言的知识,以及在测试阶段更好地利用语言模型是提高端到端模型的有效方法,具有重大的研究价值。端到端的语音识别模型是语音识别领域的前沿研究方向,具有广阔的应用前景。

  二、项目内容

  本项目将会带领学生建立一个完整的基于深度学习的端到端语音识别系统。将系统探索基于CTC和基于Attention的端到端语音识别模型以及包括基于字,基于音节的建模单元。我们将试图结合CTC 和Attention 模型各自的优势构建一个CTC和Attention融合的端到端语音识别模型。

  除此之外,我们将利用大概3000小时的中文语料搭建一个完整的端到端语音识别的线上模型,构建语音识别的云端服务。项目将详细介绍语音信号处理以及语音识别的基本知识,基于Python和深度学习框架(PyTorch)的深度学习处理的编程实现,并对CTC、Attention和对抗学习等前沿技术进行深入讲解。学生将跟随导师和实验室团队共同工作,进行深度学习、语音识别建模等相关工作。

  本科研实训项目专门为计划申请计算机科学、人工智能、数据科学、自动化、软件工程等专业的学生所设计。实习结束后,导师会根据学生表现出具推荐信。

  三、师资背景

  指导老师团队负责人为清华大学博士,香港科技大学博士后,中国科学院自动化研究所,模式识别国家重点实验室模式识别与智能系统专业研究员,博导,师承人工智能泰斗张钹院士,曾获林家翘应用数学二等奖。主要从事鲁棒性语音识别、语音增强、计算听觉场景分析、说话人识别等方面的研究工作。先后承担和完成了20多项国家自然科学基金、国家863、973计划和北京市自然科学基金等项目和多项企业项目,在国内外本领域重要学术期刊和学术会议上发表论文200余篇,多次获得顶会最佳论文奖和最佳论文提名奖。与 BAT、滴滴、小米等顶级AI公司以及美国、加拿大、新加坡等多所著名高校和科研机构保持紧密合作。

  四、招生对象及要求

  大三及以上优秀本科生(有较熟练的C、C++、Python编程以及PyTorch编程框架使用经验优先),计划申请计算机科学、人工智能、数据科学、自动化、软件工程等相关专业,为了让学生可以更好地完成科研项目,项目组会以面试形式对学生进行筛选。

  五、项目关键点

  1. 这个项目能够培养学生什么素质和能力?

  通过导师面对面指导学生完整参与一个科研实训项目,激发学生对人工智能和语音识别技术的科研兴趣,培养学生参与科研项目的基本素质和实践能力。

  2. 通过这个项目学生能够掌握什么软件或者具体知识?

  通过参与本项目,学生将能够:熟练掌握Python编程语言;理解神经网络的基本结构;掌握主流深度学习框架的搭建;熟悉语音识别的基本框架;掌握语音相关基础知识;掌握提炼总结科学问题的能力。

  3. 这个项目具体做什么应用?

  本项目将会带领学生建立一个完整的基于深度学习的端到端语音识别系统,并会基于3000小时的中文语料构建一个支持并发的云端语音识别系统。首先会构建一个基于DNN-HMM框架的语音识别系统的基线系统,然后会探索CTC 和Attention 融合的端到端语音识别系统,最后会基于端到端的模型搭建一个支持并发的云端语音识别系统。

  六、日程安排

  3个月实地训练:

 
 

  备注:实际行程安排顺序可能会根据特定原因进行调整。

  七、报名方式

  咨询电话:010-5795-2000

  地址:北京市海淀区中关村丹棱街3号中国电子大厦B座15层

  • 北京
  • 成都
  • 大连
  • 合肥
  • 西安
  • 武汉
010-5795-2000

北京总公司

全国统一咨询热线:010-5795-2000 工作时间:周一至周日(8:30-21:30) 地址:北京市海淀区中关村丹棱街3号 中国电子大厦B座15层

成都分公司

全国统一咨询热线:010-5795-2000 工作时间:周一至周日(8:30-21:30) 地址:四川省成都市锦江区红星路三段一号 IFS国际金融中心二号办公楼18层1811

大连分公司

全国统一咨询热线:010-5795-2000 工作时间:周一至周日(8:30-21:30) 地址:辽宁省大连市高新园区火炬路10号动漫游产业大厦11楼1106室

合肥分公司

全国统一咨询热线:010-5795-2000 工作时间:周一至周日(8:30-21:30) 地址:安徽省合肥市蜀山区长江西路189号之心城写字楼环球中心A座17层1703

西安分公司

全国统一咨询热线:010-5795-2000 工作时间:周一至周日(8:30-21:30) 地址:陕西省西安市碑林区南关正街88号长安国际中心A座10层1001

武汉分公司

全国统一咨询热线:010-5795-2000 工作时间:周一至周日(8:30-21:30) 地址:武汉市洪山区珞瑜路10号群光二期写字楼34层01-10号

版权所有:北京环球百利教育科技有限公司

Copyright @ 2010- Bailitop Education. All Right Reserved 备案许可证号:京ICP备11003081号-1 | 京公网安备11010802010640
京网文 [2020] 2946-474 号

打开微信

搜索“百利天下留学”

关注并回复“ZL

获取免费留学资料