打印纸张 字号选择:超大 行高 带图打印 返回原文

首页 > 文化博览 博古通今 独家讲稿

阮敬:国内大数据人才培养现状

2018年07月25日 14:10

 

阮敬

阮敬 首都经济贸易大学研究生院副院长

点击观看报告视频

我们来看看国内在数据人才培养方面是怎么做的。事实上到目前为止,国内在大数据高端人才培养方面已经做了很多工作,比如数量庞大的大数据科研机构、院校、行业协会等。通过搜集网上的文本资料,我们把国内大数据高端人才的培养方式归纳为三类:第一是以统计为依托的人才培养平台;第二是以计算机科学为依托的平台;第三是以业务为依托的人才培养。

01

上图是国内开设的大数据机构在各个省的分布情况。据统计,全国范围内开设带有“大数据”字眼项目的高校大概有28家,其中有研究院、实验室、学院,还有以此为专业名称的。截止到2015年4月,北京的机构数量最多,北京大数据协会是全国首家大数据协会。贵州每年都会举行数博会,沿海地区也很关注大数据产业的发展。整体而言,发达地区对大数据更为关注。除发达地区以外,西南地区也有一些发展大数据的天然优势,如气候宜人、地价便宜、人才需求更为旺盛等。

先说以统计为依托的人才培养平台。中国人民大学、北京大学、中国科学院大学、中央财经大学及首都经济贸易大学共同合作打造了一个大数据分析硕士培养创新平台,专门用来培养从事大数据分析的高端人才。该项目建立在全国应用统计专硕教组委的基础上,其中最关键的是设计课程内容。结合国内的实际情况,我们从国外成熟的模式中提取出了相应的主要课程,其中最核心的是与计算相关的技术,没有这方面的基础是做不好大数据的。

 

02

大家看上图,创新平台的主要课程那一项,大数据统计基础里有抽样技术、探索性数据分析、数据预处理、空间统计、数据可视化等,这些都是统计基础必须要掌握的。后面还有数据挖掘与机器学习、大数据分布式并行计算(MapReduce框架)、大数据非结构数据分析(我们前面的分析就属于非结构化的大数据分析),另外还有大数据统计建模、大数据开发基础、面向数据编程语言、大数据分析案例等。大数据分析案例的课程操作起来比较困难,因为很多公司企业不愿意提供数据让你去分析他们的情况,除非你的学生要到他那里去工作。但是这种情况下,企业会在学生去之前对他们进行挑选,非常的麻烦。那这个问题到底要怎么解决呢?现在我们鼓励创业,就要靠老师去跟外界交流,达成紧密的商业合作。该项目的目标主要是培养大数据分析人才,重点是分析,至于软件、硬件,自然有精通计算机的人去弄,这个需要相互配合。

大数据分析硕士培养协同创新平台建立于2014年9月,第一期共招收了来自5所合作院校的55位学生,他们在2016年6月已经毕业,现就职于阿里巴巴、腾讯、百度、京东等互联网企业的总部,99%的同学担任的都是数据分析、数据挖掘的岗位,薪酬都相当可观,还有个别同学去攻读数据科学的博士去了。他们受到了业界的认可,可以说已经成长为真正的大数据领域的高端人才了。

在国内,以计算机为依托的可以学习大数据技术的院校有北京航空航天大学、交通大学、中国科学技术大学、人民大学、山东大学等,其中不乏各个学校、各个部门相互合作开设的平台。他们设置的课程比较偏技术范畴,比如数据库。如果想了解大数据的软件、硬件技术或系统,可以去上述学校找到一些门路。

以业务需求为依托的培养方式落脚点比较明确,专注于培养某个特定行业里的大数据人才,你可以根据想进入的行业对号入座。

怎么练,练什么内容,需要花多长时间多少钱,国内国外的各种途径,前面我们大致都介绍到了,那么学成之后找不到好工作怎么办?有两种途径,第一种是直接转行,但是好不容易才学成,转行的话就前功尽弃了。还有一种办法是自立门派,自己去创业,接受市场的检验。市场是最好的检验标准,我们把市场上的人才招聘信息收集起来,与刚才讲到的学习内容和途径相对照,就能看出它们之间的匹配程度。我们就能知道学成之后自己适合从事哪些工作,并且了解到大概的薪资情况。匹配度可以用0到1之间的数来表示,越往1靠近匹配度就越高,应用统计的匹配度就很高,达到了0.81,不过学成之后做数据分析师的话,在全国范围内的平均工资是不高的。比较之下,做数据挖掘的薪酬就高多了,相应的难度系数也会增加。凡是带有大数据或数据分析字眼的职位我都把它们挑出来汇总到一起,比如大数据工程师。总体来说,有工作经验的普遍比没有工作经验的工资水平高,但是大数据行业发展起步得比较晚,工作时间达到四年在这个领域里已经是相当长的了。这个行业对学历也有一定要求,80%的企业规定应聘者须具有本科以上学历。刚才我们看国外的数据要求是硕士以上,这种差异主要是由于国内对硕士的培养还没达到普及的程度。招聘人数较多的职位主要集中在数据分析类,软件类的则不是很多。

匹配程度和薪资高低应与其他因素综合来看,不要一味追求高薪的职位,今年是高薪,到了明年不一定还高。总之,就市场的需求量来说,分析类的岗位是人才需求量最多的,管理类和软件类的较少,对大数据的学习一定要适应市场的需求。

 

国内大数据高端人才培养的分布情况是,北上广及以贵州、四川为代表的西南地区人才培养基地比较多,其中北京最多,上海和广东也有零星分布。北上广除了是人才培养机构的聚集地,同样也是人才需求量最高的地区。这一点很容易理解,因为经济发达,必然就有需求、有供给,培养出的人才可以直接在当地工作。反观西南地区,以有大数据基地的贵州为代表,相关人才的需求量其实很少,它培养的人才都供给到北上广等经济比较发达的沿海地区了。

最后我们总结一下通过上面罗列的一系列数据得出的结论,要修炼成大数据高端人才,要讲究“四板斧”,即需具备四种能力。

第一个是计算机技能,没有计算机技能,做数据分析可能会非常辛苦。比如计算机技能包括数据库技能,好多非结构化数据都是转化成结构化数据去做的,所以一定要在数据库管理使用的技术上下功夫。还有,比如说Hadoop和MapReduce,都是架构在Linux/Unix环境下的,这个操作系统还需要运用一些脚本语言。另外,你还要掌握大数据分析的框架,至少要做到熟悉了解。

第二个是编程技能,要做大数据分析或成为大数据高端人才,编程技能是必不可少的,比如今天我分享给大家的这个内容,其实就是用我们编程自动提取出来的信息整理得出的结论,不论对错与否,它至少是客观的。当很多信息没有现成的东西去分析的时候,你就必须去做开发编程。需要精通的工具有我们上面说到过的JAVA、C++,做统计的话用SAS、Python和R。现在还有新的框架Spark等,都需要你去熟悉了解。

第三个也是最核心的技能,就是大数据挖掘和统计建模分析的技能。很多学计算机的朋友问我,要开一家做大数据医疗的公司要怎么做。这一块的技能很难掌握,需要聚类、关联、分类等。分类很关键,人脑一直在不断分类,比如你来或者不来听我的讲座,你的脑子里面不断地在做类似的决策。你说的每一句话,每一个字都可能是分类的结果,包括我们下棋,你走哪一步,同样也是分类的结果。还有聚类,聚类就是本来没有类别,人为的划分类别,比如把人类分成男和女。如果你要跟数据打交道,多多少少应当具备这方面的技能。在此基础上,你还能对算法进行改进,如果没有改进,那你也只是停留在用一用的层面,想要自创门派或提高工作效率的话,难度还是比较大的。

最后一个是业务和管理技能。没有业务,空有一身本事也是白搭,所以必须要找一个途径去实现你的价值。我们发现有很多计算机技术好,统计模型、大数据挖掘、机器学习都学得非常好的人,在实际工作中却发挥不出什么作用,逐渐被边缘化,甚至没干几年就被开除了,这是为什么呢?这就是太过于钻研技术,没有业务技能的后果。如果连业务流程都不熟悉,要怎么去做分析呢?没有业务能力,公司里每一项业务的数据流流向,数据来了以后数据口径,就无法得出正确的结论。

综上所述,必须同时具备四大要素,才能成为一个真正的大数据高端人才。

当今时代正是大数据产业蓬勃发展的好时机。对于大数据高端人才的培养,国外有先例,国内有需求。具备以上四项能力中某一项或几项能力的人应当珍惜这份幸运,抓住这次机会,根据自身的特点进一步完善自己各方面的技能,朝着适合自己的方向去努力,有朝一日一定能修炼成才。

今天就跟大家分享这么多,谢谢大家。

(根据宣讲家网报告整理编辑,

未经许可,不得印刷、出版,违者追究法律责任)

文章来源:http://www.71.cn/2018/0725/1010969.shtml