人工智能行业的火热带动了AI人才就业的兴盛。据有关专家估计,中国人工智能学科人才需求缺口每年接近100万!

吴飞认为,人工智能渗透性很强,它与机器人、经济学、医学等专业都可以结合起来,形成‘人工智能+X’的创新应用。可以跟工学、人文、法学等连接在一起,支撑这些学科在大数据背景下发生巨大变化。

目前,中国人工智能大学排名前十名,分别是清华大学、北京大学、上海交通大学、浙江大学、复旦大学、南京大学、东南大学、哈尔滨工业大学、西安交通大学、华中科技大学。

至于薪酬方面,有专家指出,目前国内互联网和科技巨头都在大力招聘人工智能相关人才,这让这部分专业学生十分抢手。这些企业不仅包括BAT巨头,也有网易、海康威视、华为、科大讯飞等知名企业。据吴飞透露,目前人工智能研究方向毕业的博士初始年薪就可以达到30万元。

读人工智能专业正当时

其实,由于人工智能属于深入研究的方向,需要一定的基础,所以很多大学本科并没有专门、深入的AI、ML专业。尽管本科没有人工智能专业,但国内众多高校很早就开始研究人工智能了。

网易智能从中国人工智能学会了解到,该学会曾联合中国自动化学会、中国电子学会、中国通信学会等20个学会与北京大学、浙江大学等42所高校,做出了“智能科学与技术”一级学科论证报告。

目前,经国家教育部正式批准设立“智能科学与技术”本科专业的高校已达36个;在教育部研究生专业目录外,设置了“智能科学与技术”相关专业方向已达79个。

对人才的迫切需求,倒逼人工智能领域一级学科的设置亟须提速。目前国内本科没有人工智能这一专业,人工智能目前是计算机科学里的一个研究方向。另外,人工智能还与信息学紧密结合在一起的。

因此,计算机科学与技术、控制学、软件工程以及统计数学这几个专业,与人工智能结合非常紧密,在学科上具有高相关性。目前,已经有大学开设了数据科学相关专业,直接对接人工智能领域的应用。

但是,人工智能学科与相关技术在中国还不是一级学科。因为AI不是一级学科,导致人工智能相关专业教学和科研活动散落在其他多个一级学科中,智能专业课程不是重点学习内容,学时占比也较少,存在着高开低走、碎片化、低水平重复的问题,严重阻碍了中国智能科学与技术的发展和智能技术人才的培养。

今年7月份,国务院颁布的《新一代人工智能发展规划》中明确提出,大力建设人工智能学科。《规划》指出,完善人工智能领域学科布局,设立人工智能专业,推动人工智能领域一级学科建设,尽快在试点院校建立人工智能学院,增加人工智能相关学科方向的博士、硕士招生名额。鼓励高校在原有基础上拓宽人工智能专业教育内容,形成“人工智能+X”复合专业培养新模式,重视人工智能与数学、计算机科学、物理学、生物学、心理学、社会学、法学等学科专业教育的交叉融合。加强产学研合作,鼓励高校、科研院所与企业等机构合作开展人工智能学科建设。这就从政府层面肯定了人工智能一级学科的地位。随着《规划》的推出,目前各地高校已经开始筹建人工智能专业和人工智能学院。比如,近期中国科学院大学发文正式宣布成立人工智能技术学院,成为中国人工智能技术领域首个全面开展教学和科研工作的新型学院。

人工智能关键性应用

从数字/物理世界、关键/非关键应用两个维度来分析,人工智能的应用分成四大类,第一类是发生在物理世界的关键性应用,比如无人驾驶,毕竟人命关天。第二类是发生在数字世界的关键性应用,比如涉及到金融领域和计算机安全领域的问题,可能直接造成财产损失。第三类是发生在物理世界的非关键性应用,比如扫地机器人。第四类是发生在数字世界的非关键性应用,比如推荐系统。就商业应用路线而言,一般规律是从数字世界的非关键应用开始,逐步渗透到物理世界的关键应用。

发生在物理世界的关键性应用

总体而言,发生在物理世界的关键性应用技术难度非常大,比如高级别的无人驾驶,是需要长时间的培育和等待的领域。

“AI in Practice”的演讲者之一,来自谷歌的Vincent Vanhoucke以及Waymo(谷歌的无人驾驶公司)的Dimitri Dolgov都分享了一些研发机器人和无人驾驶的经验和教训。

Vincent所带领的Google Brain团队目前工作主要集中在三个领域:语音识别、计算机视觉、机器人。而Dimitri引用了加利福尼亚车管局(DMV)提供了2016年关于无人驾驶里程及失灵(Disengagements)的数据(失灵时需要人类司机来驾驶),这个数据也基本验证了无人驾驶的难度。

失灵比例最低的是谷歌,每5128英里失灵1次,可以想象的是,谷歌无人驾驶的测试数据依旧是在一定的限定环境下,特斯拉则是3英里就失灵1次。

即使是按照谷歌无人车现在这个数据,在驾驶如此高频的情况,离完全的无人驾驶(Lever 4or 5)还有很长一段距离。

按照长期以来的工业界的实践,把可靠性从90%提升到99%,往往比0%提升到90%难很多,然而从99%提升到99.99%比从90%提升到99%更难,而我们对无人驾驶可靠性的要求可能要超过99.9999%。

实现固定场景的几个英里的无人驾驶距离实现高级别无人驾驶还有漫长的一段路要走,此外无人驾驶汽车从设计到生产的周期还需要额外的3到5年的时间,该行业的创业公司的周期会非常长。不过值得一提的是,限定场景(比如高速公路)下的无人驾驶或者辅助驾驶依然很有意义。

Vincent Vanhoucke演讲的最后一部分集中在机器人!他说之前还没进入机器人领域时,看到DARPA挑战赛中机器人的各种摔倒镜头会大笑,然后真正开始接触之后,就再也笑不出来了。机器学习的研究人员会想当然地认为机器人已经大规模使用机器学习技术、想当然地认为机器人和环境状态完全已知、想当然地认为样本充足、想当然地认为计算机模拟十分逼近真实物理世界。从这个角度,机器人领域给机器学习提供了很多有意思的话题。

第一:如何协调感知和执行是机器人的关键。

机器人的感知是软件层面,而执行则是机械层面。做算法的不懂机械,做机械的不懂软件往往是业界共同面临的问题。

第二,如何提高样本的有效使用再次成为核心问题。

发生在物理世界的训练样本往往获取非常困难,以机器人手臂随机抓取物体的实验为例,Google为了获得训练样本,只能以14台机械臂在那里日夜不停地获得训练数据。如何高效率的获得样本,或者是高效能的使用样本,将是极其核心的问题。

第三:机器人领域涉及强化学习、无监督学习、主动学习。

对于机器人领域的核心技术强度学习,特别是深度强化学习(Deep Reinforce Learning),几乎所有我们拜访的工程师,包括Vincent一致认为技术实现的难度非常大。

第四:闭环控制系统对于改善性能极为必要。

第五:需要新的数据结构,用于表示运动学链接(Kinematic chain)、图像的卷积、运动轨迹。在之后的问答环节,他对迁移学习抱有厚望。

老牌的IBM业务多元化、而且绝大部分是面向企业服务市场(to B)。因此,Michael Witbrock提出对于人工智能领域的研究路线更为系统、同时也更为传统。

他提到对世界的大规模建模,由之前明确的、符号化的、分解的建模方式,逐渐融合隐形的、统计的建模方式。例如之前机器人动力学方程中对于摩擦力这类非线性变量的建模和求解时,难度就不小。

IBM强调了符号主义的重要性,认为知识表达、逻辑在解决复杂问题中非常重要。

基于逻辑的传统知识表示值得引起我们的重新思考(Rethink)。

IBM在此方面的研究优势是既有硬件,又有软件。在整个IBM的研究人员Michael Witbrock演讲中,他很自豪地介绍IBM过去在人工智能领域取得的进展,并且已经广泛部署到多个领域,其中有一项是在人力资源领域的应用。

对比一个国内的案例,某乳品巨头的人力资源负责人在谈到人工智能在人力资源领域的应用时不屑一顾地谈到人力资源的工作富有人情味,冷冰冰的机器如何应对。其实,LinkedIn的职位招聘不也是人力资源的一部分吗?传统行业如何面对高科技的进步,被颠覆还是主动整合,看似简单的答案要落到实地并不容易。

值得重视的是,随着人工智能应用入侵传统行业,通常需要对控制对象所处的物理环境建模,这一块是比互联网更广阔的天地,机会更多,当然也更难。

发生在数字世界的非关键性应用

从实现难度而言,发生在数字世界的非关键性应用最容易发生,实际上推荐系统就是一个很好的例子,一方面大家对推荐商品的准确性相对宽容。

发生在数字世界的非关键性应用挤满各种互联网公司巨头,创业公司在这个领域想有所作为也很难,或许还有垂直领域有些机会。而创业公司如何突破人才、数据、计算资源的局限,寻找生存空间值得进一步探讨。

代表Quora出场的Xavier Amatriain恰好就回答了这个问题。Quora是家是中小型的创业公司,是美国的问答网站(类似于国内的知乎)。Quora只有85位技术工程师,其中仅仅两位研究员。人才寥寥、计算存储资源不多、数据也不是那么充足,

创业公司怎么能够避免一些技术弯路,正确应用人工智能技术呢?Xavier总结了他这么多年在机器学习实际工作的一些教训。

1.更多的数据还是更好的算法?

Xavier认为更好的算法更为重要;

对于小公司而言,本身数据量就少,而获得标记的数据更是需要额外的成本。小公司堆数据肯定是堆不过大公司,所以选择把精力放在优化算法上往往比选择把精力放在获取数据上更高效

当然一方面小公司也需要不断地积累数据。

2.复杂模型还是简单模型?

Xavier认为模型和特征选取需要匹配;

模型不是越复杂越好,在创业公司往往是不管黑猫白猫,能抓到老鼠就是好猫。根据界定的问题,选取与特征相匹配的模型。

3.什么情景下用监督学习还是非监督学习?

Xavier认为非监督学习可以降低维度、并对特征做工程突破。在某些情况下,将监督学习和非监督学习结合,效果出奇的好;

4.多种算法的组合还是单一算法?

Xavier提出应该尽可能使用组合算法,不同于强调原创性的学术研究,创业公司更需要“拿来主义”,只要能用上,多尝试不同的算法组合来提高准确率是个明智的选择。

5.不要将一个模型的输出作为另一系统的输入

Xavier警告说这会是系统设计的噩梦。

发生在数字世界的关键性应用和发生在物理世界的非关键性应用

发生在数字世界的关键性应用和发生在物理世界的非关键应用对创业公司而言是机会比较多的领域。比如将人工智能用于金融领域和安全领域。又比如扫地或是玩具机器人是一个典型的发生在物理世界的非关键性应用。这两个领域是创业公司最有机会的。

人工智能颠覆性的理论突破仍需等待

通过神经科学或是其他学科与计算科学交叉,寻找人工智能新理论的突破仍停留在理论研究阶段。

虽然深度学习已经获得不少进展,然而大家至今很多领域依旧是知其然而不知其所以然,而人工智能其实理论研究获得的突破依旧。

对于现在基于概率和数理统计的深度学习而言,纽约大学神经科学教授Gary Marcus希望从神经生物学的角度寻找人工智能的突破。他刚刚加入新成立的Uber AI Lab。我们在此断章取义地引用他的观点,“目前对于人工智能最大的担心是技术发展停滞不前”!这也是我们所担心的。

在近几年深度学习的浪潮中,人工智能领域的进展更多是工程推进,而不是理论突破,尤其是海量数据和超大规模的暴力计算。正如Peter Norvig曾经谈到Google在人工智能的出色表现时,就评论到“我们没有更好的算法,我们仅仅是有更多的数据”。

而对于通用人工智能(Artificial General Intelligence),Gary继续批评过去几十年徘徊不前。现阶段的智能不能像人一样阅读、理解、推理,无人驾驶的安全也不足以让人信服……

人工智能研究的道路依旧任重道远!

(文章仅代表作者个人立场和观点)

作者: 软件定义世界(SDX)

2017-10-08