数据人才缺口数百万,华东师范大学数据专业如何提升学生三大能力
·数据专业是典型的新工科专业。传统工科强调动手能力,局限是缺乏发现问题、举一反三的思维。新工科则深化理论基础,增强创新意识,数据专业正是打破局限,开阔学生视野,培养真正有创新能力的工科人才,提升升维思考能力。
·数据产业仍在发展初期,目前逐步回归理性。以好奇心和兴趣牵引,增强自主学习能力,完善知识结构,当知识和观念能够随时更新,就能在数据中如鱼得水。
华东师范大学数据科学与工程学院副院长周烜教授
数字经济的核心生产要素是庞大信息系统记录下来的数据,数据蕴含了丰富的信息和规律,这些信息的挖掘有助于提升社会生产效率。数字经济时代需要怎样的数据人才?这些人才又该如何培养?
华东师范大学数据科学与工程学院副院长周烜教授日前在接收澎湃新闻(www.thepaper.cn)专访时谈及数据专业的建设经验。他表示,国内数据人才缺口数百万,数据人才既要懂统计学和数学,又要能够使用计算机构建软件,还要跟上行业应用步伐。数据专业是典型的新工科专业,学生的培养要兼具扎实的数据科学理论功底、过硬的数据系统工程能力,并且能够深入应用场景对实际问题进行抽象和提炼,运用理论知识和工程技术解决问题。
大数据行业在2010年左右形成一波热潮,人工智能的兴起又推动大数据进入新的高潮。数据产业仍在发展初期,目前逐步回归理性。周烜建议青年人以好奇心和兴趣牵引,增强自主学习能力,完善知识结构,当知识和观念能够随时更新,就能在数据中如鱼得水。
数据人才缺口数百万,华东师大新设8门课程提升三大能力
数据是数字经济时代的新生产要素,正促使传统生产方式发生变革。周烜介绍,自2010年起,大数据行业逐渐兴起,大量业务线上线下结合,数据越来越触手可及,数据积累速度越来越快。要让数据产生价值,提升业务效率、生产质量和用户体验,就需要专门的大数据人才。
这些数据人才包括数据科学家、数据工程师、数据架构师、数据产品经理等。数据科学家连接数据与应用需求,通过建模发挥数据作用;数据工程师主要构建数据处理系统;数据产品经理挖掘业务痛点,从应用中寻找数据需求。但周烜表示,我国数据人才缺口达数百万。
“数据”被高校作为一门专业开设始于2010年以后。2013年,美国纽约大学率先推出数据科学硕士项目。随后,中美各大顶尖高校相继开设。华东师范大学自2013年起与工业界广泛接触,坚持“应用驱动创新”,启动硕士培养。
由于本科生培养需要构建更完整的知识体系,其专业建设难度比“锦上添花”的硕士项目更大,因此数据本科专业的设立比硕士专业滞后多年。
我国教育部在2016年增设了“数据科学与大数据技术”专业(下称“数据专业”),开启国内数据本科专业建设。为优化本科专业结构,支撑引领产业转型升级,教育部引导高校根据经济社会发展需要和办学能力,加大大数据等相关专业人才培养力度,2019年新增设数据科学与大数据技术专业点196个、大数据管理与应用专业点25个。至2021年我国已有超600所高校开设数据专业。
2016年,华东师范大学建立数据科学与工程学院,2017年开始招收“数据科学与大数据技术”专业本科生,新设8门核心课程。2019年,华东师范大学“数据科学与大数据技术”专业获评国家级一流本科专业。
“数据人才需要具备三大能力:数据基础理论知识、工程实践能力和应用对接能力,工程实践能力又分为工程师能力和算法建模能力。”周烜表示,数据专业的人才培养与计算机、统计等传统专业有所区别,数据专业具有天然的交叉融合性,既需要计算机领域的技术,又需要统计与应用数学的基础,还与信息系统等领域相关,单纯修补计算机、统计或信息系统等专业的原有培养方案难以满足人才培养要求。
与此同时,工程实践能力是数据专业人才的核心能力,传统以课堂教学和考试为中心的教学方式容易导致理论与实践脱节,也缺少客观评价学生工程能力的办法。数据专业人才需要深入行业应用,具备抽象和提炼复杂应用场景中的数据问题的能力,因此数据人才教学也需要深度融入行业。
华东师范大学数据专业课程体系
华东师范大学数据专业8门核心课程中,《数据科学与工程数学基础》融合数值线性代数、概率与信息论基础及模型估计、最优化方法等数学知识和数据知识,目标提升学生数据基础能力。《数据科学与工程算法基础》面向算法设计能力锻炼。《当代数据库管理系统》、《分布式计算系统》、《云计算系统》用于提升学生工程能力。《统计方法与机器学习》、《当代人工智能》培养数据建模能力和应用对接能力。最终,“数据科学与大数据技术”专业形成理论、系统、模型方法与应用四维一体的数据专业知识结构与课程体系。
数据专业是典型新工科,工程和应用对接能力如何两手抓
2018年,教育部公布《首批“新工科”研究与实践项目的通知》,提出要把握好“新工科”建设的内涵,统筹考虑“新的工科专业、工科的新要求”,加快培养新兴领域工程科技人才,改造升级传统工科专业,主动布局未来战略必争领域人才培养。创新大学组织形式,促进“理工”“工工”结合、“工医”“工农”“工文”交叉,面向当前产业急需建立现代产业学院,面向未来发展趋势建立未来技术学院。
周烜表示,“数据科学与大数据技术”专业结合理论和工程,应对广泛的数据应用,是典型的新工科专业。传统工科强调动手能力,局限是缺乏发现问题、举一反三的思维。新工科则深化理论基础,增强创新意识,数据专业正是打破局限,开阔学生视野,培养真正有创新能力的工科人才,提升升维思考能力。
在实际教学过程中,数据专业的工程实践能力和应用对接能力如何两手抓?周烜说,华东师范大学的经验是,构建在线教学实训平台、加强产学研融合。
2017年,华东师范大学开始建设“水杉在线”平台,推动数据驱动的教学模式变革。与传统慕课平台不同,“水杉在线”利用云计算平台构建大规模线上工程实践场所,利用开源软件构建工程实践项目,并提供在线实训、在线编程自动评测和社交化软件项目协作等多项服务,让学生的工程实践全部线上进行。
“每个学生的动手能力不同,小班化教学往往适合这种工程实践能力的培养,老师有更多时间观察每个学生的情况。数据科学与工程学院刚成立时,我们采用小班制,招生规模扩大后,我们将数字化融入教学。”周烜介绍,学生工程训练的过程在线上留下了数据,“水杉在线”平台全面采集学生的学习行为数据,通过数据分析掌握学生的个性特点和能力发展需求,实现工程能力培养的个性化。基于学生工程实践行为数据,洞察学生解决问题的思路和方法,评估学生运用知识解决实际问题的能力,实现过程性评价。
华东师范大学数据驱动的个性化实践教学模式
“我们重视科研跟产业的结合,在这个过程中积累了丰富的应用案例和经验。”为了将现实行业应用引入教学,华东师范大学数据科学与工程学院实践了以“校企联合实验室”和“企业奖学金”为基座的产学研融合人才培养新模式,引进工业界具有实战经验的高端技术人才,形成复合型教师队伍,与百度等企业建立了7个面向不同行业的联合实验室和人才培养实践基地,将企业实际应用问题引入实践教学。针对物流科技公司,学生通过大数据预测车辆排队时间,节省司机时间,通过调度提升装卸效率;在金融领域,学生通过大数据预测客户流失、监测金融欺诈。
“人工智能是实现建模的能力,背后真正依托的是数据,数据的数量和质量决定了预测的准确性。我们特意训练学生深入应用场景,对实际问题进行抽象和提炼,锻炼思维能力。”周烜说。
一批可复制的教学经验涌现,以好奇心和兴趣牵引自主学习
为构建实用的数据专业知识体系,华东师范大学项目组牵头发起成立了“数据科学与工程专业建设协作组”(下称“协作组”),联合国内15所高校,基于人才培养目标,实践了计算机、统计、应用数学和信息系统的多学科交叉教学。
目前华东师范大学“数据科学与大数据技术”专业本科生入学人数已达350人。学生毕业后,80%选择进一步深造,“大部分继续攻读数据专业,也有一部分学生转到金融等细分行业方向,还有一部分进入计算理论、人工智能理论等理论领域。”就业学生多进入金融等数据应用已成规模的行业。
同时涌现一批可复制、可推广的教学经验。自2018年起,参与数据科学与工程专业建设协作组的15所高校将华东师范大学数据专业的教学成果应用在各自的数据专业人才培养中。协作组共同编写的《数据科学与工程专业人才培养方案与核心课程体系》2020年初在高等教育出版社出版,该书影响了全国大部分从事数据专业建设的高校。
华东师范大学设计的“数据科学与大数据技术”专业核心课程的教材与配套资源中,目前已完成并正式出版的有《数据科学与工程导论》、《数据科学与工程算法基础》、《云计算原理与实践》、《分布式计算系统》、《区块链导论》,完成交稿的有《数据科学与工程数学基础》。
此外,专业课程中,《数据科学与工程导论》、《数据科学与工程数学基础》、《数据科学与工程算法基础》、《云计算原理与实践》、《当代数据管理系统》、《分布式计算系统》、《区块链系统》等线上课程已完成建设,并在多个平台投入使用。
未来华东师范大学数据科学与工程学院还将如何完善培养体系?对此,周烜表示,一方面将“根据输出迭代过程”,通过追踪观察毕业学生的能力发展,调整教学方案和课程。
另一方面,学生在初等教育中养成的部分思维方式在高等教育中成为教学痛点,学生内卷现象普遍。“我们正在对最新一届的学生进行教学改革。一是压缩学生必修课,增加选修课,让学生修读的内容更加多样化,不在一个赛道上过度竞争。同时在选修课上增添了荣誉课程,鼓励学生创新,深入研究问题。二是改变学生成绩评定方式,A是优秀,P是通过,F是不通过,并且不设置比例。”
“大数据行业在2010年左右形成一波热潮,人工智能的兴起又推动大数据进入新的高潮,因为当前的人工智能是数据密集型的人工智能。”但周烜也表示,目前大数据行业逐步回归理性。从技术发展角度来看,技术变得更加成熟,更多工具可被利用,数据逐渐发挥价值,大数据行业的发展趋势是可确定的平稳上升。而产业界对数据人才的需求不断变化,“数据行业的知识更新速度快,只有具备自主学习能力,未来才能在业内发挥价值。”周烜建议青年人以好奇心和兴趣牵引,增强自主学习能力,完善知识结构,当知识和观念能够随时更新,就能在数据中如鱼得水。