【探索AI自开发】谷歌、微软用AI开发AI,特定任务超越人类AI专家

  • 我要分享:

【AI WORLD 2017世界人工智能大会倒计时 2

“AI达摩”齐聚世界人工智能大会,AI WORLD 2017议程嘉宾重磅发布

在2017年11月8日在北京国家会议中心举办的AI World 2017世界人工智能大会上,我们邀请到 阿里巴巴副总裁、iDST副院长华先胜 旷视科技Face++首席科学家、旷视研究院院长孙剑博士, 腾讯优图实验室杰出科学家贾佳亚教授,以及 硅谷知名企业家、IEEE Fellow Chris Rowen ,共论 人脸识别等前沿计算机视觉技术


抢票链接: http://www.huodongxing.com/event/2405852054900?td=4231978320026

大会官网: http://www.aiworld2017.com

新智元报道

来源:Google Research; microsoft; NYT

编译:费欣欣


【新智元导读】 为了应对AI人才不足,以谷歌为首的企业正在想方设法,开发能够取代AI研究员的AI系统,让创建AI软件变得容易。目前,这样的AI系统正在帮助AI研究员,让搜索更高效,让网络结构更先进,同时承担繁重重复的工作。但是,AI取代AI研究员的那天终会到来,只是时间的问题。



开发出能够自己编写程序的AI,是AI研究者的梦想,也可能是众多计算机程序员的噩梦。现在,以谷歌为首的各大公司,在AI人才严重不足的情况下,开始把目光投向另一个更为强大的目标——开发能够自己创建AI的AI。


谷歌的项目名叫AutoML,ML是机器学习“Machine Learning”的缩写。顾名思义,AutoML就是能够自己创建其他机器学习系统的机器学习系统。


谷歌大脑负责人Jeff Dean已经在多个场合公开宣传这一项目,相信AutoML将在不久后将为谷歌带来能够部分取代人开发AI的AI系统。


“我们希望AutoML的能力能抵上现在几个博士之和”


谷歌CEO Sundar Pichai在谷歌年度开发者大会I/O 2017展示了AutoML,“它的工作方式是,我们采用一组候选神经网络,然后用一个神经网络来遍历它们,直到我们找到最好的神经网络。”Pichai 解释说。“我们希望AutoML的能力能抵上现在几个博士之和,并且能在3到5年的时间里,为成千上万的开发人员设计出新的神经网络,满足他们的特殊需求。”


不止是谷歌,微软、亚马逊、Facebook这些巨头纷纷都在开发能够自己开发AI的AI上面投注努力,这正在形成一种趋势。


AI被视为未来核心技术之一,但据估计,全世界仅有约1万人具备开发复杂先进数学算法的教育、经验和能力,而这些算法是驱动AI创新的基础。谷歌、Facebook、微软等公司为了吸引顶尖AI人才,频频开出百万乃至千万美元年薪,加剧市场对AI人才的追捧。


现在,AI人才不仅从学术界流向工业界,更从小公司流向大公司,大有在几大AI巨头最终聚首的趋势。


然而,巨头饥渴还远远没有得到满足。例如Uber的AI实验室负责人在接受《卫报》采访时就表示,工业界招揽人才的步伐和频次只会加重。培养一个AI人才需要花费数年时间,工业界不愿意等待。于是,企业正在想方设法,开发各种工具,一切都是为了让创建AI软件变得容易。


“我们正在遵循计算机科学每一种新技术发展曾经走过的轨迹,”微软VP Joseph Sirosh说:“我们正在把很多苦活累活给省去。”


微软DeepCoder,让神经网络学习自动编程


2017年2月,微软研究院与剑桥大学宣布他们合作开发了一种新的算法,名叫DeepCoder。作者在论文“DeepCoder: Learning to Write Programs”中介绍,DeepCoder是一种能根据问题的输入输出自动编写解题程序的算法。


“我们使用神经网络的预测来增强编程语言社区的搜索技术,包括枚举搜索和基于SMT的求解器。我们从经验上表明,相比强大的非增强基线(strong non-augmented baselines)和一个递归神经网络方法,我们的方法速度提高了一个数量级。并且我们能够解决的问题,其难度与编程竞赛网站上最简单的问题相当。”


根据微软亚洲研究院机器学习组副研究员李亚韬发表在知乎上的解读,DeepCoder算法的框架中,神经网络负责完成两个任务:一是观察输入输出之间的关系,例如输入是否全是负数,输出是否从小到大有序等等,将其转换成机器理解的一组特征——以前是用手工方法列举这些规则,而DeepCoder使用神经网络将这一过程自动化;二是以观察到的特征作为输入,预测程序中可能有哪些语句,不像枚举法那样执行大量重复操作,生成无意义的程序,神经网络搜索会让解题效率大大提高。


DeepCoder解题过程示意图:每行代表一个程序,每列代表一种语句。红色越深代表其神经网络给出的预测值越高;绿色代表最终搜索得出的正确结果。


李亚韬副研究员表示,目前来看,包括DeepCoder在内的现有程序生成算法还不能独立处理较为复杂的问题。但从另一方面看,既然机器已经能够完成简单的编程任务,那么我们就可以利用它来辅助程序员的工作,或者帮助普通计算机用户来自动化一些工作流程。


谷歌AI设计的网络已经超越了人类设计的网络


正如上文所说,AutoML最开始是一个自动搜索神经网络的工作。谷歌大脑在他们发表在ICLR 2017 论文“Neural Architecture Search with Reinforcement Learning”中指出:深度网络已经成功将机器学习范式从特征设计转向网络结构设计。


AutoML改变网络结构设计:左边是人设计的网络,右边是机器设计的


在ICLR 2017上的那项工作中,谷歌大脑结合深度学习和强化学习,让AutoML自动生成CNN、RNN等网络结构,生成的网络泛化能力与人工设计的网络结构相当,但是规模要略小于人工网络,说明了方法的有效性。 (值得一提, 在CIFAR-10上生成CNN结构的实验中,谷歌大脑使用了800个GPU 来完成训练。有研究人员评论称,这样的工作正是谷歌应该做的,利用其优渥的、别处无法企及的硬件基础设施,得出更好、更小,需要的计算资源也更少的网络,能被其他研究人员和开发者使用。)


同时,为了让这种方法应用于ImageNet这样的大规模数据集,就在上周,谷歌大脑的研究人员对AutoML做了升级:重新设计搜索空间,让AutoML找到最好的层,然后多次堆叠,创建最终的网络;并将在CIFAR-10上最好的架构迁移到ImageNet图像分类和COCO物体检测上。


用这种方法,AutoML分别找到在CIFAR-10和ImageNet图像分类、COCO物体检测中的最佳层。这些层结合形成了一种新的网络结构NASNet(下图中红点),这个网络 在ImageNet图像分类任务中,在验证集上的预测精度达到了82.7%,超过了之前所有的初始模型。



在上图中,谷歌大脑展示了在图像分类任务中与人类设计的、最先进的各种网络(黑点),与机器自己生成的NASNet在精度之间的差距。


至少在这项任务中,机器设计的网络领先。


AI取代AI研究员的那天终会到来


谷歌的设想是,类似AutoML这样的项目,将能帮助企业构建他们自己的AI系统,尤其是那些没有深厚AI经验和实力的企业。Jeff Dean预计,如今具备能自我开发AI系统的人才的公司,全球不超过1000家,但其他更多公司却拥有开发AI系统所需的数据。


“我们希望让解决机器学习问题的机构数量从几千家扩展到百万家。”Jeff Dean说。


谷歌还有其他巨头这样做,并不是单纯为了服务世界。谷歌正在大力投资云计算服务,而云也是谷歌预期中接下来几年自己的主要经济引擎。在招揽了大批顶尖AI人才后,谷歌云在这场以AI为核心的竞赛中拔得先机。


而AutoML无疑将成为谷歌更有力的工具。参与谷歌AutoML项目的研究人员Barret Zoph表示,AutoML自己学习搜索到的算法,有时候比有人类研究员开发的性能更佳。


这背后有一股更大的趋势,也被研究人员叫做让机器“学会学习”(learning to learn),或者“元学习”(meta-learning)。很多人都相信,这种方法将显著加速AI进步。


“最终计算机将代替我们发明算法,”伯克利教授Pieter Abbeel表示:“计算机发明的算法将能以很快的速度解决很多很多的问题——至少目标是如此。”


元学习并不会彻底取代AI研究人员,目前,谷歌的AI研究人员仍然负责重要的设计工作,AutoML的目标是让有限的AI专家能够服务于更多更广的项目。


但AI取代AI研究员的那天终会到来。CMU的Renato Negrinho也在研究类似AutoML的项目,他说“只是时间的问题”。



深入了解AI 技术进展和产业情况,参加新智元世界人工智能大会,马上抢票!


【AI WORLD 2017世界人工智能大会倒计时 2 点击图片查看嘉宾与日程。


抢票链接: http://www.huodongxing.com/event/2405852054900?td=4231978320026


AI WORLD 2017 世界人工智能大会购票二维码:


相关推荐

0条评论

还可输入140个汉字

发表