过去一年,AI领域的作者数、具有重大影响的科学论文数、以及自称的AI专家数均有了显著提升。
摘要
一些有力的证据表明,AI顶级人才供不应求。但是对于人才的稀缺度和集中度却缺少精确的信息。为此,element.ai团队连续第二年对全球AI人才的范围和广度进行调查。其研究主要依赖3个数据来源。1)AI领域21个领先的科学会议的出版物,分析其作者的概况。2)分析若干LinkedIn定向搜索的结果,看看有多少人自称是博士并且具备相应的必须技能的。3)外部报告及其他二手来源,帮助寻找相关背景,并更好地理解迅快变化的全球AI版图中的人才情况。
报告发现,2018年有22400人在一或多个机器学习的顶级会议上发表了论文,比2015年提升了36%,比去年也涨了19%。同行评审的出版物数量也比2015年提高了25%,比去年提高了16%。不过在这些会议上发表文章的研究人员当中,女性仅占18%,显得名额不足。报告还发现,全球的AI人才池是高度流动的,大概有1/3的研究人员的雇主所在国家与其获得博士学位所在国家是不一样的。报告的分析表明,在21种刊物上发表过作品的作者当中有18%(约4000人)对有着重大影响的研究(以过去2年被引用数为衡量)做出过贡献。而拥有高影响力研究人员最多的国家依次是美国、中国、英国、澳大利亚以及加拿大。
对LinkedIn简历的辅助调查表明,有36524人符合自称的AI专家资格,这比2018年的报告数字增加了66%。
此次调查的发现表明,无论是自我报告的AI专家数量,还是作者和在AI会议上发表的科学论文数量,均有了显著的提升和拓展,这反映出该领域的活力和国际化。
介绍
对AI专家的需求空前高涨,自学习的算法预计可让公司更好地驾驭发展性,获取重要但此前不可见的信号,提供实时洞察,帮助员工更好地完成工作。
去年的第一次全球AI人才调查确认了一个AI业界的普遍假设:即有人工智能经验的博士很难找。今年的调查将学术会议的样本从3个提高到21个。同时还细分了性别、人才流动以及影响力指数情况。同时,报告还收集了LinkedIn上面的简历情况来评估自我报告的AI专家趋势。最后,报告还将发现与外部报告和来源的数据进行关联。
女性在AI会议出版物作者中的占比依旧不足
我们去年跟《连线》合作分析了人才池的情况,试图弄清楚女性在机器学习研究人员的占比。我们的评估认为目前这个领域的性别平衡问题依然非常严重:去年调查的3个领先的AI学术会议里面,我们发现只有12%的作者是女性。
今年的调查范围扩大到了21个学术会议,结果发现虽占比有所提升,但这个群体的女性名额依然不足,比例为18%左右。根据我们的调查,AI存在的这种性别不平衡体现在了产业和学术两方面:我们的数据表明学术界 19% 的会议作者为女性,而产业界的女性作者占比为16%。
考虑到机器学习潜在的广泛社会影响,女性在AI开发和部署方面的参与度是个重要问题。Facebook AI研究实验室负责人Joelle Pineau教授阐明了要增加本领域女性数量的理由:“相对于其他领域我们肩负着更多的科学责任,因为我们正在开发会影响很大一部分比例人口的技术。”OpenAI的CEO Sam Altman也提出了类似的观点,称机器学习在博士毕业生的性别方面是“目前我所知道的最扭曲的领域”,同时又是“对我们未来所生活的世界会产生最大影响的领域”。
据斯坦福大学发布的2018年AI指数报告,女性在学习AI和机器学习课程的大学生当中的占比也不足:学习斯坦福2017年的《AI导论》课程的 74%为男性学生,加州大学伯克利分校的比例则是73%。报读《机器学习导论》的女性占比甚至更低,斯坦福大学这门课程男学生占到了 76%,而加州大学伯克利分校同样课程的男学生占比更是高达79%。同一份报告还发现,美国绝大部分AI职位的申请者都是男性(71%)。
此次调查的数据表明,不同国家/地区之间的性别差距各不相同。女性作者占比高于18%的平均水平的国家/地区包括西班牙(26%)、台湾(23%)、新加坡(23%)、中国大陆(22%)、澳大利亚(22%)、美国(20%)、瑞士(19%)。在绝对数量上,美国的女性作者数量最多,其后是中国、英国、德国、加拿大、法国、澳大利亚、印度、意大利与新加坡。
培养出顶级AI专家的国家在雇用人才方面也领先
来自美国、中国、英国、德国、加拿大的作者占了72%
我们的会议研究人员数据让我们得以观察论文作者是在哪里接受培训的。首先,在培养AI人才方面,美国继续领先优势:在这份调查的会议作者样本中,44%的作者的博士学位是在美国获得的。而在中国受训的作者占到了约11%,其后是英国(6%),德国(5%)以及加拿大、法国和日本(均为4%)。
雇用数据也显示出了类似的地理分布特征。我们的调查表明,美国雇主继续吸引研究人员前往工作,样本数据中46%的人替美国的雇主工作,中国排名第二,占比为11%,第三的英国占比为7%。加拿大、德国、日本各占样本的4%。排名前18的国家就占到了作者总量的94%。而排名前5的国家美国、中国、英国、德国、加拿大的占比达到了72%。
会议样本绝大部分都是学术界的(77%),23%在产业界工作。尽管业界一些最大的私营公司仍继续吸引人才入驻其总部,但我们也看到很多公司开始招聘专家让他们在母国的办公地点工作。这份报告也把这些人看成是为公司总部所在国工作。比如说,某人是在法国修得博士然后在Google的法国分公司工作,报告会把此人看成是在法国受训为美国公司工作。所以在统计方面美国受益是最大的。
为他人做嫁衣——培养博士的国家未必总是受益
人才流动情况
左侧:在哪里获得博士学位;右侧:在哪里工作
本次的会议数据还分析了研究人员在完成博士学业后去到了哪里工作。总体而言,我们发现在样本当中将近有1/3(27%)的研究人员工作的雇主所在国家跟他们接受培训所在的国家是不一样的。在作者数量至少在150以上的国家当中,这个比例甚至高达32%。这些人才流动的全球地图很复杂,背后的故事当然是跟个人密切相关的。但无论如何,这一数据能让我们对AI人才的跨境流动一探端倪。(编者注:从中国的人才流入和流出来看,我们还是净流入的多;而美国流入流出的体量都很大)
首先,我们的数据表明,某些国家对机器学习领域的研究人员特别有吸引力。总部在美国的雇主吸引海外受训研究人员的几率最高。中国是吸引在别国拿到博士学位的研究人员可能性第二大的国家,在吸引的研究人员数量上几乎是美国的1/4。我们估计会有若干因素对此产生影响,其中就包括每个国家的相关职位情况。
其中人才流入大于流出的10个国家/地区是:中国台湾、瑞典、韩国、西班牙、美国、瑞士、中国、日本、英国、澳大利亚。而在接受海外专家方面的赢家是瑞士和瑞典,外来人才占比分别达到了50%和49%。
不同国家人才流入流出情况对比
这一数据还可以让我们对比每个国家/地区的人才流入流出情况。人才流入表示的是在x国/地区工作但是在y国/地区拿到博士学位的人数除以x国/地区的AI人才总数。这个指标可以用来衡量一个生态体系对人才的吸引力。
四象限:左上——锚定国;左下——生产国;右上——邀请国;右下:平台国
另一方面,人才流出表示的是在x国/地区拿到博士学位但现在为y国/地区的雇主工作的人数,再除以x国/地区的AI人才总数。这个比例可以看出一个国家/地区留住人才的能力。
跟平均水平相比,澳大利亚、西班牙、中国台湾的流入情况要大于流出。这意味着这些国家/地区在挽留自己培养的人才并吸引外来人才方面相对更加成功。这些生态体系我们称之为邀请国。相反,法国、以色列这样的国家属于生产国,因为跟平均水平相比,其人才流出要高于人才流入,但是差距并不大。
美国的人才流入和流出情况都相对较少。这并不能反映出其人才库的深度:就绝对数字而言,美国依然是全球领先的人才磁石。相反,它反映的是人才库的相对稳定性。中国、德国、印度、意大利、日本和韩国也呈现出相同的模式。这类国家我们称之为锚定国。
最后,还有好几个国家的人才流入和流出都高于平均水平。这些国家成功地吸引了海外培养的人才,同时期研究生流动也高于平均水平。这些生态体系我们称之为平台国。,其中包括了加拿大、荷兰、新加坡、瑞士以及英国。
我们的会议数据还发现一些国家之间的人才交流引人关注。中美之间的交流尤其突出,所以整体而言谁都没有占太大的便宜:我们发现在我们的22400名研究人员数据集当中有约500位是在中国拿得到博士学位然后为美国雇主工作的,不过也有约500名字美国拿到博士学位的人为中国的雇主工作。美国与英国之间也有类似的现象。
重大影响研究:美国、中国、英国、澳大利亚、加拿大领先
今年的调查还发现在顶级国际学术会议上出现的作者数量比去年增加了19%。为了评估这些作者目前在领域内的影响力,报告分析了其 2017、2018两年间出版物的被引用情况。其中有18%(约4000人)具有较为显著的影响力。这些人也是致力于将理论付诸应用的团队想要争取的对象。
而具备高影响力的作者的国家也主要集中在几个国家,分别是美国(1095)、中国(255)、英国(140)、澳大利亚(80)以及加拿大(45)。
不过如果分析高影响力作者在本地AI人才中的占比的话,情况会有所改变。这指标反映的是培养本地顶级人才的能力。这方面澳大利亚排名第一,18%的作者发表了具备重大影响的文章,其后是美国、英国和中国(均为13%),瑞士(11%)、新加坡(9%)、瑞典和西班牙(8%),以及以色列、加拿大与意大利(7%)。
总体而言,最具影响力的研究更有可能出自学术界而不是产业界。但是有些国家尤其如此。中国的高影响力研究是最有可能出自学术界的(90%),紧随其后的是意大利(86%),美国(84%),德国(83%)以及中国台湾(81%)。而来自产业界的占比最高的国家是法国(30%),其后是印度和以色列(29%),西班牙(28%)以及英国(27%)。
社交网络数据表明更多人是自称的AI专家
我们的会议研究人员数据表明在AI领域的21个顶级学术会议上发表论文的作者和论文数量均有了显著提升。为了了解就业市场是否有同样的情况,我们调查了全球使用最广泛的职业社交网络LinkedIn。
我们的研究对象是那些具备机器学习技术能力、若干工作经验,并且能够在交叉学科环境下写作的职场人士。搜索包括了“数据科学家”、“研究科学家”、“机器学习工程师”、“机器学习研究人员”以及“数据分析师”,而且学历必须是博士。最后检索出36524名符合条件的人士。相比之下,去年的数据为22064,也就是说比去年增长了66%。
跟去年,今年的调查发现,LinkedIn上的AI专家主要集中在美国、英国、加拿大、法国以及德国。不过,增长率最快的国家是意大利、突尼斯、以色列、爱沙尼亚以及阿根廷。
从LinkedIn样本分析来看,这些专家的主修专业各不一样。其中计算机科学是占比最高的(28%)。而且在一些国家这个比例甚至还要大,比如法国(47%)和中国(44%)。类似地,一些国家其中一些学科的占比也比平均水平突出。比如物理专业的平均占比为9%,但在德国其占比却高达28%。另一个例子是数学和统计。平均占比为18%,但以色列、美国这个数字就升到了27%,而俄罗斯更是高达35%。
不同国家的学科差异
计算机科学约占1/3,但不同国家差异很大
当然,利用LinkedIn分析有一些问题需要注意。首先是LinkedIn上面的信息都是用户自述的。其次,LinkedIn的代表性对一些国家来说并不足。LinkedIn自称有44%的美国人在上面有简历,加拿大的占比也有38%。但俄罗斯的占比比却只有5%,而中国更是只有3%。
不过对于使用LinkedIn活跃的国家来说,LinkedIn上面的活动能够为AI领域的人才规模和兴趣改变提供洞察。就本次调查而言,我们发现机器学习专业出现了显著的提升。这有可能是反映出一个日益重视AI技能与专业知识的市场推动了人才库的扩张。
全球的AI人才热点
中国
从会议作者数据看,约11%的会议作者是在中国培养的,也有相同比例的作者是为中国雇主工作。在样本中中国占领女性作者的12%,其中有14%发表了最有影响力的研究。2018年在顶级会议上发表论文的作者当中,有13%属于高影响力群体。
在AI方面,中国有着若干优势。其中包括大规模的数据,具有活力的创业环境,政府支持等。根据清华大学 2018年6约发布的《中国人工智能发展报告》,中国在论文总量和高被引论文数量上都排在世界第一,中国已经成为全球人工智能专利布局最多的国家,风险投资上,中国人工智能领域的投融资占到了全球的60%,成为全球最“吸金”的国家。但是,在顶级AI人才这个关键方面占比较低(排名依次是美国、英国、德国、法国、意大利和中国)。而在人才总量,方面,该报告认为中国仅次于美国。但是有迹象表明中美之间的差距很快就会缩小:Allen Institute for Artificial Intelligence(艾伦人工智能研究所)最近的一项研究发现,到2020年,中国的高影响力出版物就将超过美国。这也许就是中国的AI战略将培养顶级人才列为优先事项的原因之一。
这项战略的部分内容似乎是将海外工作的中国研究人员带回中国,在提供杰出研究岗位、奖金补贴的激励下,成功地吸引了成千上万的研究人员将自己的工作带到中国,其中绝大部分都是来自美国。与此同时,中国还建设了超过300座“创业园区”,让海外学生和人员回国。
来自美国国家科学基金会的数据表明,相对于之前,称学成后愿意留下来的在美国获得数学或者计算机科学博士学位的中国博士生占比下降了。2012至2015年期间,中国学生占到了非美国籍的赴美留学博士生的42%,其中有87%的人说打算留下来,说绝对要留下来的比例也有57%。尽管表示学成后要留在美国的中国学生的占比仍高于世界平均水平,但相对于2004到07年期间,这两个数字实际上是下降了,那段时间表达留下来意愿的占比为91%,说绝对会留下来的占到了65%。这些数据表明,在美国修完数学和计算机科学博士学位的海归正在越来越多。
像国内这样的人才招募计划,再加上AI领域空前的投资所带来的商业机会,正在成为部分研究人员考虑将实验室迁往中国的激励因素。另一个考虑因素是所谓的“竹子天花板”:亚裔的STEM毕业生得到外国公司的雇用可能很容易,但是晋升却不能像部分同事那么容易。2015年对Google、惠普、英特尔、LinkedIn以及Yahoo进行的一项雇用数据研究表明,尽管亚裔占到这些公司专业劳动力的27%,但主管的占比却只有14%。
美国
在超过36500份LinkedIn简历的样本里面,有将近一半(15747)是在美国的。其中很大一部分(约20%)目前或者之前在微软(1077)、IBM(667)、Google(697)、Amazon(511)以及或者苹果(393)工作。这些简历当中 87%都有至少6年的经验,而且几乎全都(97%)称有至少3年的经验。这个人才库当中约有1/3都是在旧金山湾区工作。
在会议数据方面,美国几乎在每一个指标的绝对数方面都是领先的。在美国受教育的人占到了样本论文作者的将近一半(44%)。受雇美国公司或大学的占比达到了46%。在女性群体扎伊占比甚至更高:数据集的的4085名女性当中,有1960(48%)是为美国雇主工作的。在美国机构工作的高影响力(论文被引用数排名靠前)作者占到了60%。高影响力人才占到了美国AI人才的13%。其中学术家占领84%,产业界占16%。
美国在若干指标领先并不出奇。一方面,美国在基础AI研究上依旧领先。据李开复的说法,美国致力于在未来30到40年维持“研究领导力”和研究生教育方面的全球领先优势。
此外,美国公司和美国政府在AI研发方面的投入很大。Facebook、苹果、微软、Google和Amazon这些美国巨头均在机器学习方面加倍下注。OECD 2018年12月发布的一份报告称,无论是从交易额和交易数量来看,自从2011年以来,绝大部分的AI初创企业股权投资都流向美国公司。美国军方也在积极投入AI研究:比方说DARPA在2018年11月就宣布未来5年投入20亿美元用于“创造第三波AI技术潮的新老计划”。
结论
我们的2019 全球AI人才报告表明,过去一年,AI领域的作者数、具有重大影响的科学论文数、以及自称的AI专家数均有了显著提升。不过女性的名额依旧不足,但有一些国家在性别均衡方面表现得更加出色。从人才分布的地缘情况看,美国在几乎每一个指标的绝对数方面都是领导者。但这个领域无疑是非常国际化的,每一个本地生态体系都有独特的优势和战略。专注于培养这一领域专业人士的国家正在帮助将AI人才库的蛋糕做大,从而推动本领域向前发展。