一、项目背景
近几年,大数据迅速发展成为科技界和企业界甚至世界各国政府关注的热点。从社会经济角度来讲,大数据是第二经济的核心内涵和关键支撑。第二经济的概念是由美国经济学家在2011 年提出的。他指出由处理器、链接器、传感器、执行器以及运行在其上的经济活动形成了人们熟知的物理经济(第一经济)之外的第二经济(不是虚拟经济)。第二经济的本质是为第一经济附着一个“神经层”,使国民经济活动能够变得智能化,而第二经济的主要支撑是大数据,因为大数据是永不枯竭并不断丰富的资源产业。借助于大数据,大数据分析也应运而生,并且基于大数据分析技术,未来第二经济下的竞争将不再是劳动生产率而是知识生产率的竞争。
相较于传统的数据,大数据的特征可以总结为5 个V,即体量大、速度快、模态多、难辨识和价值大密度低。但大数据的主要难点并不在于数据量大,因为通过对计算机系统的扩展可以在一定程度上缓解数据量大带来的挑战。其实,大数据真正难以对付的挑战来自于数据类型多样、要求及时响应和数据的不确定性。因为数据类型多样使得一个应用往往既要处理结构化数据,同时还要处理文本、视频、语音等非结构化数据,这对现有数据库系统来说难以应付;在快速响应方面,在许多应用中时间就是利益。在不确定性方面,数据真伪难辨是大数据应用的最大挑战。追求高数据质量是对大数据的一项重要要求,最好的数据清理方法也难以消除某些数据固有的不可预测性。
为了应对大数据带来的上述困难和挑战,以Google,Facebook,LinkedIn,Microsoft等为代表的互联网企业近几年推出了各种不同类型的大数据处理系统。借助于新型的处理系统,深度学习、知识计算、社会计算、可视化等大数据分析技术也得已迅速发展,已逐渐被广泛应用于不同的行业和领域。
二、师资背景
任职教师为中科院知名研究所副研究员,博士生导师。每年均成功推荐多位学生赴海外名校深造,有良好的科研短训经验。主要研究方向为分布式系统,数据挖掘和机器学习等,在IEEE Transactions on Knowledge and Data Engineering,Special Interest Group (SIG) on Knowledge Discovery and Data Mining,International Conference of Data Mining,IEEE International Conference on Communications 等国际著名期刊及会议上发表论文50 余篇。现担任某SCI 国际期刊的编委。
三、项目内容
目的:本项目旨在通过理论与实践相结合的方式,以大数据分析技术在金融、医疗、交通和网络安全等行业应用为背景,介绍了不同的大数据处理模式与代表性的处理系统,并对深度学习、知识计算等重要的大数据分析技术进行介绍,为数据科学与大数据技术的进一步学习和实践应用打下必要的基础。
过程:学生将跟随导师共同工作,实际动手搭建大数据处理系统和设计大数据分析算法等工作,最后利用所学知识演示行业大数据分析效果。
四、项目亮点
导师会结合在研的科研项目介绍大数据处理系统以及大数据分析技术前世今生,让学生能够更好理解大数据分析的意义。同时导师会亲自指导学生开发面向金融、医疗、交通、网络安全等大数据分析算法。
收获:通过本项目的教学,以及学生们对于大数据处理和分析技术的动手实践,充分体会大数据分析算法结合大数据处理系统在金融、医疗、交通、网络安全等领域带来的效果,使学生初步具备编程的素质,并且能够具备运用大数据工具解决实际问题的能力。
五、项目安排
六、招生对象及要求
适合年级:大二、大三
适合专业:计算机科学与技术、软件工程、网络空间安全、经济、金融、商科等相关专业
基本要求:有编程基础和软件工具使用基础/有项目经历的本专业或跨专业学生
评定方式:面试
七、报名方式
咨询电话:010-5795-2000
地址:北京市海淀区中关村丹棱街3号中国电子大厦B座15层