图灵奖得主吉姆·格雷曾将科学技术发展史总结为四个范式:第一范式是经验证据,源于对自然现象的观察和实验总结;第二范式是理论科学,对自然界某些规律做出原理性的解释;第三范式是计算科学,通过计
顺晟科技
2022-10-20 08:48:11
112
图灵奖获得者吉姆格雷(Jim Gray)曾将科技发展的历史概括为四种范式:
第一范式是经验证据,来源于对自然现象的观察和实验总结;第二种范式是理论科学,从原理上解释一些自然规律;第三种范式是计算科学,通过计算模型和系统模拟对复杂过程进行科学研究;第四范式是数据科学,即经过实验观察、理论推导和计算模拟后的数据驱动的科学研究。
从科学研究的角度来看,数据驱动的研究和分析无疑是令人兴奋的。多尺度复杂化学系统模型的建立、引力波的发现、人类黑洞的第一张照片,都是第四范式下的典型案例,越来越多的前沿领域开启了“新篇章”。
但对于许多高校来说,数据驱动的科学、教学和研究既是机遇也是挑战:“第四范式”对大计算能力的需求持续增长,对大数据的要求变得更加严格,知识生产的逻辑不断刷新.能否对新问题给出新答案,将直接影响未来教育的发展方向。
01人才培养和计算能力困境
很多人可能看到过这样的新闻报道:中国人工智能人才缺口超过500万,但目前供需比只有1:10。
其实早在2018年,教育部就发布了《高等学校人工智能创新行动计划》,逐渐在国内掀起了开设人工智能专业的热潮。到2020年初,教育部再次发布《关于“双一流”建设高校促进学科融合 加快人工智能领域研究生培养的若干意见》,要求构建基础理论人才和“人工智能X”的复合型人才体系。
据不完全统计,全国已有800多所高校开设了AI相关专业,从双顶院校逐渐延伸到普通本科和高职院校。包括戴尔科技在内的企业与高校联合开设AI实践课程,国内围绕AI人才的培养体系初步形成。
与此同时,一个新的问题出现了:人工智能不是一个纯理论的研究课题。如果按照金字塔分级,对理论创新型人才的需求并不高。急需的是将算法模型转化为工程路径,将人工智能与落地场景相结合的应用型人才。相对于理论研究的教学方式,人工智能人才培养的重点在于应用实践。
但是人工智能落地的第一道坎是计算能力,而计算能力的话语权在某种程度上决定了高校在人工智能前沿研究中的地位,以至于国外很多高校在计算能力上投入很大,计算能力的规模几乎不亚于科技巨头。
英国杜伦大学智能NIC环境超级计算机拥有16个节点的计算集群,搭载戴尔技术的PowerEdge C6525服务器和NVIDIA ConnectX智能网络适配器(SmartNIC),大幅提升大规模并行代码的计算性能;密歇根大学使用Dell PowerEdge服务器构建了具有13,000个内核和强大功能的五大湖超级计算机。它像企业一样运营着一个学术超级计算中心,并实施了相当严格的日常成本控制。
中国也意识到一些高校面临的计算能力困境。
比如《“十四五”国家信息化规划》,在十大任务的第八项“构建普遍便捷的数字民生保障体系”中,明确提出要“提升教育信息基础设施建设水平,构建高质量的教育支撑体系”,重点优化网络基础设施,升级校园基础设施,目的是解决部分高校在计算平台上的短板。
02中国计算平台方案
与海外高校不同,国内很多高校需要“补上”的不仅仅是计算能力的短板,还有教学实践、虚拟仿真、科研创新、课程建设等等。
原因不难解释。人工智能的开始可以追溯到1956年的达特茅斯会议。即使
更何况,目前我国人工智能人才缺口主要集中在把人工智能放到生产线上的数字蓝领人才和应用型人才,这也是人工智能专业不断向普通本科和高职院校下沉的原因。正如教育部副部长孙瑶公开表示,“职业教育要瞄准数字时代的新技术和产业变革,大力培养高素质的技术技能人才。”
与此相对应的是,戴尔科技与剑桥大学、杜伦大学等高校的合作主要集中在服务器和运维层面。在中国市场,因地制宜推出了面向教育行业的全栈AI解决方案,覆盖基础设施层、平台层、应用层。
基础架构层包括Dell PowerEdge系列AI计算服务器,如PowerEdge T550塔式服务器、PowerEdge XE8545机架式服务器、全新PowerEdge R750xa机架式服务器等。以及端到端基础设施解决方案,如高性能数据存储产品、高速互联数据交换网络和HPC就绪解决方案。
值得一提的是,戴尔PowerEdge服务器内置了英伟达DPU和英伟达GPU,可以帮助教育行业提升AI工作负载的性能,建立零信任的安全基础。它拥有先进的AI训练、AI推理、数据处理、数据科学和零信任安全能力。
平台层包括包含GPU、FPGA和CPU分布式训练的计算资源管理和优化库,TensorFlow、PyTorch等深度学习框架,面向GPU的AI-ready解决方案,GPU虚拟化弹性计算架构,GPU动态加速云等服务。顶层应用层覆盖AI制造、AI零售、AI教育、AI金融、AI医疗等主流应用场景。
例如,戴尔为教育行业提供了一套功能齐全的“中央厨房”。高校可以低成本把食材烹饪成美味佳肴,甚至一些人工智能基础设施相对薄弱的高校也可以少走很多弯路。就像一些企业高价买的GPU,整个AI进程被I/O瓶颈拖累,全栈AI解决方案巧妙的避免了不必要的试错。
03学科教研一体化的新范式
毕竟,对于大多数高校来说,在产学研深度融合的背景下,拥抱人工智能的价值不在于过程,而在于结果。
或许,与时间相比,国内高校与人工智能的接触要晚很多。但一旦消除了计算基础设施的限制,国内巨大的市场体量和人才需求,以及对人工智能人才培养的重视,正在沉淀出适合不同层次人才的培养方案。更何况,一个又一个实际落地的案例,已经让外界看到了一个新的科教研一体化的范式。
复旦大学与戴尔合作推出ADAS人工智能实践课程,是目前最热门的自动驾驶课程,为学生提供理论与实践相结合的学习方式:一方面是学校精心打造的理论教学体系,另一方面是企业带来的行业视野、创新实践和方法论,进一步拉近在校学生与自动驾驶的距离,不再像过去那样停留在纸面上。
另一个可以找到的例子是中南大学的教育可视化平台。中南大学于2020年初启动了在线教学工作,通过戴尔的PowerEdge服务器快速完成网站加载和视频转码。即使在几乎满负荷运行的场景下,依然保持了出色的转码性能和高稳定性,有效提升了中南大学的在线教学质量。
还有一些高职院校,也与戴尔产生了宝贵的“火花”。哈尔滨职业技术学院利用Dell Precision工作站搭建了一个元宇宙视觉生态的VR动画平台,不仅为学生打开了一个VR的新世界,还将3D动画制作效率提高了2-3倍,动画教学效率提高了3-4倍。
甚至以北师大二附中为代表的中学也在戴尔技术的范围之内。第二中学校长
隐藏在这些案例背后的,其实是国内高校的创新与活力,不断阐释着计算能力自由后的种种可能。随着戴尔科技的全栈AI解决方案和其他大计算平台逐渐在越来越多的高校落地,势必会呈现更多令人瞩目的案例。届时,科学、教学和研究的融合将是自然而然的结果,“第四范式”带来的挑战将变成机遇。
04写在最后。
或许多年后再看数据驱动的科研、教学、科研转型,只着眼于人才培养,可能是“狭隘”的。
无论是人工智能的教学还是科研,都是一个由浅入深,由慢到快的过程。至少,戴尔科技的大计算平台给教育行业带来了“计算加速”,一些高校已经提前看到了科研和教育的新范式。戴尔科技和英伟达将为教育行业提供AI训练、AI推理、数据处理、数据科学和零信任安全能力。
当类似的解决方案越来越多的时候,教育行业和计算基础设施之间的鸿沟将被逐渐抹平,其连锁反应将远超想象。
20
2022-10
19
2022-10
19
2021-08