重磅!剑桥年度AI全景报告出炉美顶尖AI人才中27%具备中国教育背景90%的AI人才选择留美

进入 2020 年,在疫情黑天鹅以及新基建以极快的速度成为共识的大背景下,AI 真正迎来了属于自己的高光时刻。

今年全球人工智能领域人才的分布是什么样子?AI 领域有哪些研究和突破?AI 产业有哪些新风向?未来又有哪些新趋势?

三、AI 产业:医疗、自动驾驶正在全面利用 AI 

剑桥大学这份年度 AI 全景报告或许能告诉你答案。

而对于小兹维列夫在隔离期间参加聚会,蒂姆也发表了自己的看法。“他应该像我一样,检测结果也是阴性,唯一的错误就是他一开始发布了声明,然后不够走运在聚会时被拍到了。不过我不喜欢人们批评他的方式,他被当成小学生一样看待,但他已经23岁了。这是兹维列夫的错,但我不理解为什么那么多人想要插一脚。克耶高斯自己也犯了很多错。他最好能洁身自好,而不是来批评别人。”

2018 年至 2019 年,提到联邦学习的论文数量增长了近 5 倍。2020 年上半年发表的论文比 2019 年全年都多。

在人工智能领域里,美国仍然是国际研究的中心,有 90% 在美国毕业的留学博士都会留美继续工作。

与此同时,许多 AI 领域的美国博士毕业生毕业之后会前往英国和中国就职。去英国的毕业生中,55%选择在私营部门工作;去中国的人当中 40% 选择去私营部门。 

不过,当前的大多数机器学习应用是通过统计来实现功能的,其忽略了人类学习知识的重要方法——因果推理。在为患者寻找诊疗方案等任务中,因果推理是更好的方式。Judea Pearl、Yoshua Bengio 等人工智能先驱者都认为,因果推理是使得机器学习系统更好地泛化,更强大稳健,并为决策作出更大贡献的新方向。

自 2018 年以来,在加利福尼亚州拥有自动驾驶汽车测试许可的 66 家公司中,只有 3 家被允许在没有安全驾驶员的情况下进行测试,其分别为 Waymo(谷歌)、Nuro 和 AutoX。

刘友宾称,今年秋冬季攻坚行动将聚焦人民群众反映强烈的重污染天气,继续保持方向不变、力度不减,同时,更加突出精准治污、科学治污、依法治污,做到时间、区域、对象、问题、措施五个精准,实施企业绩效分级分类管控,强化联防联控,立足于抓好已出台的政策措施落实,防止层层加码。坚持问题导向,压实部门和地方责任,加大帮扶力度,实现打赢蓝天保卫战圆满收官,让人民群众享受更多蓝天白云。

和往年一样,该报告援引的数据来自知名科技公司和研究小组。新版 AI 全景报告全方位总结过去一年来 AI 领域的研究成果与突破、人才形势、产业动态等,并作出未来预测。

人工智能教授的流失与全美 69 所大学的毕业生创业能力下降有关。

对于自己这个密切接触者始终没有进行自我隔离而是连续参加表演赛,蒂姆也作出了解释。“亚德里亚巡回赛后,我连续十天每天都做检测,直到潜伏期结束,这比去隔离要好,我不知道为什么在我健康的时候应该要在家里呆着,这就是我决定参加比赛的原因。”

即使在政策最为开放的加州,迄今为止自动驾驶汽车的行驶里程相比人类也是微不足道——自动驾驶汽车公司在 2019 年的自动驾驶里程比 2018 年增加了 42%。但这仅相当于 2019 年有驾照加州驾驶员行驶里程的 0.000737%。

还有数据表明,尽管美国的 AI 技术领先,但大多数在美国工作的顶级人工智能研究人员都不是在美国接受本科教育的,中国(27%)、欧洲(11%)和印度(11%)是美国 AI 人才的最大几个输送国。 

3、NLP 模型趋势

研究论文代码的实现对于 AI 的可问责性、可再现性和推动进展至关重要。

在 2004 年至 2018 年间,谷歌、DeepMind、亚马逊和微软从美国大学聘请了 52 名终身教授和终身教授。卡内基梅隆大学、华盛顿大学和伯克利大学在同一时期失去了 38 位教授。值得注意的是,2004 年没有一位人工智能教授离开,而仅 2018 年就有 41 位人工智能教授离开。

5、AI 人才供不应求

“凯文-德布劳内可能是世界上最好的中场,他却要鼓掌致敬一些连给他系鞋带都不配的球员。”

尽管如此,来自 Indeed 的数据显示,招聘职位的数量仍约为求职者数量的三倍。

而且,美国医疗保险和医疗补助服务中心也提出了基于深度学习的医疗成像产品费用标准。未来,优先使用 AI 技术将在医疗领域越来越常见。例如,利用人工智能设计药物已经在日本进行了临床试验,而一大批创业公司也得到了大量资金用于实现平台战略发展。

一般来说,人工智能终身教授离职 4-6年后,毕业生创办人工智能公司的可能性降低了 4% ;但这种并不适用于教授在学生毕业前 1-3 年就离开的情况,这表明教授和学生之间的互动很重要;但人工智能教授的离职与同一所大学的毕业生成立非 AI 公司之间也没有显著的相关性。

自 2016 年中期以来,该领域在这一指标上几乎没有改善。传统上,学术团体比行业团体更有可能发布他们的代码。没有公开所有代码的著名组织有 OpenAI 和 DeepMind。

二、AI 人才:人才外流,27 % 有中国教育背景

在膝关节二次修复手术之后,费德勒宣布退出了2020赛季的所有比赛,把目光投向了2021年。在赛场上拼杀了20多年,即将迎来39周岁生日的费天王,对网球的热爱丝毫未减,他的这份执著和坚韧不拔的精神令人赞叹。

生物研究正在经历「AI时刻」:仅 2020 年,就有超过 21,000 篇相关论文发表。自 2017 年以来,涉及生物领域人工智能方法(如深度学习、NLP、计算机视觉、RL)的出版物同比增长了 50%。自 2019 年以来发表的论文占 2000 年以来所有论文的 25%。

另一方面,大尺寸模型正在推动着 NLP 领域的技术进步,OpenAI 的 GPT-3 等新研究已经把深度学习模型的参数数量推到了千亿。

随着时间的推移,这一事件的关注度逐渐走低,球迷们认为很快就要偃旗息鼓了。就在这时,在本国参加表演赛的蒂姆突然在接受媒体采访时发声,为德约科维奇鸣不平,为自己的行为辩解,同时也对澳大利亚坏小子克耶高斯批评小兹维列夫的做法表示不满。“德约科维奇并没有犯什么罪,我们都有错。我无法理解为什么大家把错都归咎于他。我去过尼斯,也看过其他城市的情况,和亚德里亚巡回赛贝尔格莱德站的情况没什么不同。现在来指责德约科维奇实在是太容易了。”

关于“亚德里亚之旅”巡回表演赛的组织者德约科维奇和其他参赛球员因在赛事期间行为失当,导致多人感染新冠病毒的事件已经过去半个多月了。这期间,德约科维奇一度遭到多方的抨击和指责,承受了巨大的舆论压力。参加表演赛的德国人小兹维列夫和奥地利名将蒂姆也因为在本应自我隔离期间参加聚会和频频参赛而遭到各界的批评。

刘友宾强调,不抓好秋冬季大气污染防治,如遇到极端不利的气象条件,区域性重污染天气过程会卷土重来,不仅会影响“十三五”规划和蓝天保卫战收官目标的完成,也会损害全面建成小康社会的成色。

报告显示,在美国工作的顶尖 AI 人才中,27% 有中国教育背景,但他们在毕业后有 54% 会去美国攻读研究生博士,这其中又有 90% 选择留美工作。

不过,人们也在研究提高模型效率的方法,OpenAI 的统计表明:自 2012 年起,训练深度学习神经网络进行 ImageNet 图像分类要想达到特定的水平,其所需的算力每 16 个月减半。

下面来关注瑞士天王费德勒的消息。近日,费天王在接受Zeit专访时再次提到了退役的话题,不过他仍然表示自己现在没有退役的打算,还将继续站在赛场上。“退役是越来越近了,我是如此地热爱网球。对我来说,现在退役很容易,但我想给自己一个机会,继续享受打比赛的美好时光。”

当然,老教授的离开可能会为年轻的学术人才腾出晋升的阶梯。而与此同时,也有一些学者并不买账。

最后来关注一条球员动态。经过两周的自我隔离和治疗,在克罗地亚扎达尔确诊感染新冠病毒的丘里奇接受了核酸检测,结果是阴性。克罗地亚名将也成为继德约科维奇、特洛伊基之后,第三个成功“阳转阴”的球员。在获知这一消息之后,球迷们纷纷送上祝福,盼望他早日重返赛场。

AI 领域的人才需求不断增长。许多一流大学也在扩大 AI 专业的招生规模。以斯坦福为例,最近几年斯坦福 AI 领域的学生是 1999-2004 年的十倍之多,与 2012-2014 年相比 AI 领域学生数量也是翻了一倍。

还有很多球迷一直在惦记着“亚德里亚之旅”表演赛第一位感染者迪米特洛夫,他的康复情况怎么样了?成功“阳转阴”了吗?有球迷喊话,迪米宝宝你快些报个平安吧!

AI 研究的开放性并没有我们想象的那么高,只有 15% 的论文会开源他们的代码。

蒂姆的这番言论犹如在本已平静的水面投下一枚石子,一下子激起层层涟漪,关注度猛增。而球迷们的看法也各有不同,有支持蒂姆的,也有反对的声音。而被蒂姆diss的克耶高斯自然不会放过这个打嘴仗的机会,他迅速作出回应,“蒂姆你在说什么?我犯的错是摔拍、骂人、消极比赛这样的?还是每个人都做过的?凭你们的智商都不知道我这样做是为了什么。我只是想让他们为自己的行为负责。这真是一个笑话,你们像傻瓜一样在全球疫情肆虐期间参加派对。这段时间,人们失去生命、失去他们的至爱和朋友,蒂姆竟然为错误说话。这几个人可是我们网坛的顶尖力量,真是无语到摇头。”

在 AI 模型训练需求越来越多算力的同时,传统计算机架构却在逐渐接近摩尔定律的终点。MIT 等大学的研究称,科学家如果希望将 ImageNet 数据集图像分类任务的错误率从 11.5% 降到 1%,可能需要数百亿美元的投入。

“我认为这(仪式)有点胡闹,我不知道从哪里开始的,为什么开始。如果是我这样做会感到不舒服,我会做的,因为必须这样,但我不想,因为不是发自内心的。”

国内的出行公司滴滴最近也把自动驾驶业务剥离,并从软银远景基金等机构筹集了 5 亿美元。今年 7 月,滴滴在上海推出了自动驾驶汽车服务。

 在 2019 年 Neur IPS 接受论文的作者中,有 29% 在中国获得本科学位。但在离开中国的大学后,54%的毕业生前往美国在 NeurIPS 发表论文。

据统计现在约有 47% 的实现是基于 PyTorch 的,而 TensorFlow 的大约为 18%。PyTorch 提供更大的灵活性和动态计算图,使实验变得更加容易。JAX 是个对数学更友好的Google出品框架,通常在卷积模型和 transformer 之外的工作中受到青睐。

根据目前的云服务算力价格,训练每 1000 参数的模型平均需要 1 美元,拥有 1750 亿参数的 GPT-3 可能需要花费百万美元级别的费用,有专家认为这一数字超过了 1000 万美元。高昂的训练费用,让研究人员们在探索新方向时遭遇了挑战。

自动驾驶领域的公司,必须要有强大的资金支持。13 亿美元被亚马逊收购的 Zoox,其自 2015 年以来收获的融资已超过了 9.55 亿美元,Zoox 最新的估值约为 32 亿美元。交易文件显示,Zoox 在 2020 年初每个月要烧掉 3000 万美元。

克耶高斯的这番话出人意料地得到很多球迷的支持。他们认为网坛缺少的就是像克耶高斯这样秉性耿直、敢想敢做、仗义执言的人。也有球迷认为坏小子就是在出风头,刷存在感,说话太伤人。他的确应该先把自己的屁股擦净再去管闲事。唉!本以为风平浪静,却不想再起波澜。有道是,功过是非自有公论,但愿这场纷争早日结束吧!

考虑到美国人工智能产业对移民的依赖程度,特朗普宣布暂停 H1-B 签证引起了强烈反弹。 八起联邦诉讼和数百所大学反对 。

3、美国依赖人工智能人才

但不可避免的是,2020 年人工智能领域的人才市场受到了新冠疫情的严重影响。根据领英发布的数据,2020 年机器学习领域职位原本强劲的增长趋势在 2 月受到打击,开始下滑。

“如果我是利物浦球员,曼联赢得了联赛冠军,你知道他们比你出色,你尊重这一点,你会争取像他们一样,这样他们知道你尊重他们。”

比如,深度学习将超分辨率显微镜成像从采集到分析进行了改进,使用监督学习和计算机视觉将人体显微镜下的数小时时间缩短为几分钟。超分辨率显微镜通常需要主题专家来评估样本,ONI 的系统自动化这些视觉检查任务和解锁超分辨率非专业用户。

疫情期间,很多科技公司将 AI 医疗影像识别技术投入使用。

4、 生物学的“ AI 时刻”:仅在 2020 年,就有超过 2.1 万篇论文

人工智能领域研究者的分布情况近几年呈现出几种新的趋势。

一、人工智能研究进展:只有 15% 的论文会公开代码,PyTorch 超越了 TensorFlow

而非美国籍的 AI 博士毕业生毕业之后很有可能到大型科技公司就职,而美国籍的博士毕业生更有可能去初创公司就职或加入学术界的研究行列。

2、中国学者的重要性凸显

毋庸置疑的是,GPT-3、BERT 等模型已经让 NLP 领域的研究进入了新的阶段。现在甚至出现了自动翻译编程语言的无监督机器翻译工具。在 GitHub 上把 C++ 函数翻译至 Java 准确率达到 90%。

对于科技公司来说,它们的代码通常与无法发布的专有伸缩基础设施交织在一起。这表明人工智能人才和计算机的集中化是一个巨大的问题。

“球迷们不想你这样做,球员们并不真的想这样做,都是为了效果,没有任何意义。”

刘友宾指出,近年来,全国空气质量持续改善,出现了稳中向好的趋势,但大气治理成效仍不稳固,特别是进入秋冬季以来,“2+26”城市近期再次出现了污染过程,虽然总体污染程度和范围影响相比往年都有所降低,但也是一次警醒。

以 NeurIPS 2019 为例,谷歌、斯坦福、卡内基梅隆大学、MIT 和微软发表的论文数量位居前五。