一、项目简介
自然语言处理关注如何让机器更好地理解人类语言。自然语言处理技术在自动问答、机器翻译等领域得到了广泛的应用。百度度秘,微软小冰,苹果siri都是自然语言处理技术的结晶。近年来,随着深度学习技术的发展,自然语言处理在人工智能领域备受瞩目。如何利用深度学习模型,更好地解决自然语言处理领域的核心任务,是目前的研究热点。
本课程旨在全面介绍自然语言处理目前的研究和应用现状,详细阐述主流深度学习模型的设计思路,介绍词向量表示的优越之处;同时将理论与实践相结合,以文本分类为应用实例,指导学生迅速掌握深度学习平台和方法。实习结束后,导师会根据学生表现出具推荐信。
二、项目内容
本项目旨在通过理论和实践相结合的方法,让学生学习自然语言处理基础知识,深度学习相关理论基础、快速掌握深度学习主流平台。课程将全面介绍自然语言处理的核心问题和技术挑战,阐述深度学习目前在文本处理中的应用现状和发展趋势,同时对主流深度学习模型(以卷积神经网络为例)从理论原理到具体实现进行一个深度的剖析。此外,课程将以文本分类为应用实例,指导学生采用深度学习模型解决实际问题,培养学生的创新思维和独立解决问题的能力、为自然语言处理和深度学习的进一步学习和应用打下良好的基础。
三、师资背景
任职教师为中国科学院某知名院所副研究员。主要研究方向是数据挖掘、深度学习、社会计算等,在AAAI、ICDM、PAKDD等国家知名会议和期刊上发表论文30余篇。担任多个国际会议PC chair和审稿人。
四、招生对象及要求
大二以上优本科生及有较高计算机水平的高中生,计划申请自动化、计算机,软件工程、交叉学科(如商科、金融等数据分析)相关专业。为了让学生更好地完成科研项目,项目组会以笔试和面试的形式对学生进行筛选。
五、项目安排
第一周
自然语言处理基础知识学习:学习自然语言处理的基本概念、自然语言处理领域的核心问题、难点与挑战,自然语言处理的应用现状和发展趋势。约定时间与学生在线交流,对学习中存在的问题并予以解答。
第二周
深度学习概念、应用和开发平台学习:学习深度学习的基本概念,机器学习方法的统一设计框架,几种主流深度学习模型(卷积神经网络、循环神经网络、对抗生成网络等)的应用领域和发展前景。学习和掌握至少一种深度学习开发框架(如tensorflow平台)。约定时间与学生在线交流,对学习中存在的问题并给以解答。
第三周
词向量(Word Embedding)详解:介绍自然语言处理任务中词的表示模型,包括词袋模型、聚类模型和嵌入表示方法,介绍目前几种主流的词嵌入学习模型(CBow、Skip-gram)的设计思想和主要原理。安排学生学习相关文献,约定时间与学生在线交流,对学习中存在的问题予以解答。
第四周
文本分类课题实战:介绍文本分类的基本思想,采用词嵌入表示和深度学习模型解决该问题的基本思路。指导学生实现一个基于卷积神经网络的文本分类模型。安排学生学习相关文献,约定时间与学生在线交流,对学习中存在的问题予以解答。
六、报名方式
咨询电话:010-5795-2000
地址:北京市海淀区中关村丹棱街3号中国电子大厦B座15层