alphago围棋软件下载机器人什么时候战胜围棋选手

关注微口网微博
微信号:iweikou
柯洁仍是输给了AlphaGo……
今日上午,AlphaGo迎来了与围棋等级分排行国际第一的我国棋手柯洁的第一场对战。在经过289手激斗、长达四个小时半的对弈以后,尽心竭力的柯洁仍难奈毫无动摇的人工智能,以四分之一子的最细小距离惜败。
本次竞赛采取了三局两胜的的赛制,别的两场竞赛将在25号和27号别离举办。
围棋天才柯洁:从不屑到谦逊
AlphaGo2.0
跟着近些年来人工智能概念的不断开展,AlphaGo的呈现从头将这一担忧摆在了咱们眼前,由于AlphaGo的智能程度乃至逾越了咱们的幻想。
围棋的棋盘反正各有19条线,共有361个落子点,两边替换落子。在一局围棋中,均匀每一步的下法大约有200种也许。
描绘围棋也许性的动画
汉代彩绘灰陶围棋俑(距今2100年)
在咱们纷繁猜想Master是何方神圣之时,AlphaGo团队发布:“Master”背面恰是升级版AlphaGo。”
在韩国国手李世石输棋以后,柯洁曾放出豪言:就算阿法狗打败了李世石,但它赢不了我……
AlphaGo1.0
&&AlphaGo离真实的人工智能还很远由 DeepMind 规划的围棋人工智能 AlphaGo 是一个很智能的体系,在不断打败国际冠军后,人工智能再一次变成焦点论题。
虽然其间包括许多“无用”或“不合规矩”的也许性,但围棋的杂乱程度可见一斑。因而,围棋因其改变莫测的招式变成了AI(Artificial&Intelligence,人工智能)难以霸占的“禁地”。可是,这个国际总有“不信邪”的人,DeepMind开发的AI程序AlphaGo乃至打破了咱们几千年来堆集的关于围棋的“真理”,而这恰是引起咱们惊惧的源泉。
联系以上现状咱们不难发现:咱们本来正处于一个弱人工智能年代,例如苹果手机的Siri功用,各种人机对战……不可否认,弱人工智能在某种程度上能够机械地代替人类完结作业,可是一旦作业中需求有所调整,弱人工智能就力不从心了,因而,人类的思想现在依然是无可代替的。 
AlphaGo与人类正面交锋开展至此,输赢明显已不主要,而真实被垂青的是“人与AI,谁主沉浮”的评论。&AlphaGo“降服”了人类作为一款围棋人工智能程序,由DeepMind公司开发的AlphaGo一经面世便所向无敌。在本场竞赛之前,简直一切的猜测都指向AlphaGo“必胜无疑”。
不过有专业人员表明:虽然AlphaGo的算法规划十分精妙,它依然依据对大数据的暴力核算运算,这和人工智能的运作进程彻底是两回事。
赛后,柯杰表明:“AlphaGo的许多思想和对棋的一些理念在改动咱们开端的对围棋的观点。我也遭到它的影响,即是没有啥棋是不能下的,能够斗胆去定心,开辟自个的思想,更自由地去下棋。”
但在以后的十多年中,虽然核算机与信息技能的迅猛发,但在竞技竞赛范畴中,人工智能范畴的开展却逐步沉寂下去,鲜有传出与“深蓝”相媲美的高光时刻。
因而,AlphaGo的不按常理出牌却又碾压真理的做法不由让咱们置疑:人工智能的“魂灵”终究有多可怕?
棋盘上也许呈现的局势总数到了远大于国际中原子总数的境地。这意味着围棋一共也许有10^171(1后边有171个零)种也许性。
围棋起源于三千多年前的我国,虽然该游戏只要两个十分简略的规矩,而其杂乱性却是难以幻想的。
此外,研制者表明:人类在长期的竞赛中会因疲惫而犯错,但电脑程序不会,人类也许一年只能下一千盘棋,而AlphaGo一天就能下一百万盘。
在AlphaGo横空出世并屡次打败国际各路围棋高手之时,Nature 杂志以封面论文的方式介绍了 AlphaGo的凶猛的地方,主要原因有两个。
2、抛弃了蒙特卡洛树查找,不再进行暴力核算。从前史做法看,AlphaGo2.0走棋十分敏捷,约在每10秒钟就走棋一步,如此速度很也许是抛弃了暴力的核算。
面临业界的质疑,AlphaGo明显没有让咱们绝望。在尔后的竞赛中,一路改写咱们对机器人的知道。
2016年12月,奥秘棋手“Master”登录我国弈城围棋网,以天天十盘的速度接连打败中外各大顶尖棋手,取得了空前绝后的60连胜。咱们耳熟能详的工作棋手如古力、常昊等纷繁被斩落马下,柯洁也意外变成它的手下败将。
受父亲喜爱下国际象棋的影响,哈萨比斯从三四岁开端就对棋类产生了爱好,并在13岁时就变成了该年龄段国际排行第二的国际象棋大师。与此一同,哈萨比斯对核算机也有着相同激烈的爱好,并展现出过人的天分。
日是能够写进史书的一天,关于人工智能和人类对弈的论题在这一天得到激化。一场国际上最会下围棋的人与人工智能的超级对弈,被全人类经过网络直播一同围观。而终究,被给予期望的李世石九段仍是以1:4的比分意外败给AlphaGo。
不久后,柯洁乃至自动约战AlphaGo,在微博上隔空喊话:来吧!管你是阿法狗仍是阿法猫!我柯洁在棋上啥大风大浪没见过?让风暴再来的强烈点吧!
在本次面临面的对决之前,柯洁又一次述出了自个的心声,他表明:不论输赢,这都将是我与人工智能终究的三盘对局……我会用我一切的热心去与它做终究的对决,不论面临再强壮的对手——我也绝不会撤退!
3、极大地强化了增强学习的效果,之前敲边鼓的算法,正式变成扛把子主力。
能够这么推理:凡是有门户和个性,就还有局限性。只要当一切门户合一看不出门户的时分,才抵达至高境地。AlphaGo 2.0便会是这么一台机器,没有个性,稳如磐石。
柯洁承受采访时说,人与人的竞赛和人机大战不相同,内行棋判别和招法上很有也许是不相同类型的。它的判别很明白,每一步都比你走得大。别的,阿尔法能够避开许多杂乱改变,核算力强,许多思想都带给棋界腾跃性的革新,十分强壮。
真实意义上的人工智能应该是能够像人类相同应对不相同层面的疑问,而不是只是只会下围棋。不只如此,人工智能还具有自我学习、了解杂乱理念等多种才能。
在微博中,柯洁从前说:人类几千年乃至没人沾到围棋真理的边,而跟着AlphaGo的取胜,新的风暴行将来袭,咱们将会与电脑终极一战寻求围棋的真理。&AlphaGo强在哪?你也许还不知道:今日与柯洁对战的AlphaGo现已和上一年KO李世石的AlphaGo“判若鸿沟”,AlphaGo早已变得更强壮了……
与李世石交兵以后,AlphaGo团队沉匿名了近一年的时刻,总算又以AlphaGo2.0的身份重出江湖,本次打败柯洁的即为全新的AlphaGo2.0程序。
围棋的也许性超乎幻想
真理的推翻?
如此自傲的情绪不由让咱们愈加等待他们真实的对决。可几个月后,柯洁的情绪却发生了回转,这一回转源于他与AlphaGo的化身“Master”的竞赛。
AlphaGo的父亲
(图一十)
1、抛弃了监督学习,没有再用人的3000万局棋谱进行练习。这本是AlphaGo最亮眼的算法,也是今日干流机器学习不可避免的中心条件:依赖于优异的数据,在这个特定疑问下就这么被再次突破了。
作为一个95后,柯洁年纪轻轻就闪现了超人的围棋天分。在年间,柯洁曾接连夺得百灵杯国际围棋揭露赛冠军、三星杯国际围棋揭露赛的冠军,并在梦百合杯国际围棋揭露赛摘得冠军,收成自个国际大赛第四冠的一同也变成我国首位连任同一项国际大赛冠军的围棋选手。
从最开端的不懈、到谦逊到服输,柯洁情绪的改变也反映了大多数人关于AlphaGo乃至关于人工智能的心思。&人类在怕啥?上世纪90年代,IBM超级核算机“深蓝”打败国际象棋国际冠军,引起了“电脑是不是逾越人脑”的热议。
因而,AlphaGo2.0不断制作咱们意想不到的走棋,并且这些走棋在教科书中会被以为是初级过错或许彻底不可理喻,但偏偏剑走偏锋,AlphaGo2.0逐步占据了优势并取得成功。
德米什·哈萨比斯
现在,关于国际象棋、德州扑克、乃至麻将牌一类的竞技游戏都产生了破解的技能,但关于围棋来说,破解的也许性简直为零。
在奥秘棋手横扫网络棋局之时,柯洁也无法失利,乃至一度忧心住进了医院。在此以后,傲慢的少年不见了,随之而来的是一个对技能敬畏的柯洁。
(图一十一)
Alphago进行了几千万局的对弈,并对这些局势进行核算剖析,然后才得到了与人类相同的棋力。但一个天才棋手到达平等程度的棋力,只需求下几千盘棋,不到Alphago的万分之一。因而,Alphago的学习功率依然是十分低下的,这说明,它依然没有触及到人工智能中最实质的有些。
(图一十二)
(图一十三)
依据揭露材料估测,这次AlphaGo2.0的技能原理与之前有着无穷不相同:
AlphaGo与李世石交兵的场景
(图一十四)
哈萨比斯表明,在围棋博弈中,虽然人的直观感触和洞察力能够表现决定性效果,令咱们一向以为围棋是人工智能不也许打败人类的范畴,可是,“咱们即是要应战这种不也许。”
(图一十五)
2、AlphaGo有自个学习和进化的才能。它调集了3000万种工作棋手的下法,数百万次深度学习与自我对战,十分挨近带着直觉和第六感的人类大脑,能以57%的概率猜测与其对阵人类的水平。
那真实的人工智能又是啥姿态呢?
AlphaGo的成功不只震动了国际,也让其创始人、google“深度思想”公司CEO德米什·哈萨比斯变成引人瞩意图明星人物。
1、AlphaGo运用的是蒙特卡洛树查找,它会在下棋时剖析每一步的风险系数,比如在将来20步的N种情况下,它当即就能判别出怎么落子的胜率最高。
1997年出世的围棋天才——柯洁
人工智能体系“深蓝”打败国际象棋国际冠军
2016年,在一场隐秘实验中,初出茅庐的AlphaGo在没有任何让子的情况下,以5:0打败我国旅欧工作棋手、法国围棋总教练樊麾二段。此音讯一出便在围棋界引起无穷颤动:机器人打败了围棋冠军?这,不现实吧……
比较于别的脑力竞技游戏来说,了解围棋的终究意图十分难,由于它并不像象棋那样,有着直接清晰的方针,在围棋里,彻底是凭直觉的,是一种度势的艺术,是人类尖端才智的代表。
1997年“深蓝”在国际象棋打败国际棋王卡斯帕罗夫,这给哈萨比斯带来了很大的冲击。十余年后,哈萨比斯和兄弟一同在伦敦创建了“深度思想”公司,安身人工智能范畴,开端开发“阿尔法围棋”软件。
在AlphaGo横扫围棋界的一年多时刻里,没有谁的感触能与这位少年相同好事多磨了,而他即是年仅20岁的围棋天才——柯洁。
(图一十六)
2014年1月,google公司以4亿英镑(约合6.3亿美元)将“深度思想”公司收归旗下,并让哈萨比斯持续担任“深度思想”的首席执行官。
就像DeepMind创始人、阿尔法狗之父戴密斯·哈撒比斯(Demis Hassabis)所说的那样:这次竞赛输赢并不是最主要的,人类老是赢家。
(参考材料来历:网易智能、网易科技、果壳网、汹涌新闻、我国经济周刊、我国科学报、新民晚报等)
(图一十七)
看过本文的人还看过
人气:1334 更新:
人气:656 更新:
人气:536 更新:
人气:481 更新:
财经网的更多文章
大家在看 ^+^
推荐阅读 ^o^
『中國邊疆研究與歷史書寫』研討會日程安排
过真伤己、过直伤人
中国人走得太远太快,灵魂跟不上了(深度好文)
他说第二,有人敢说第一吗?
猜你喜欢 ^_^
24小时热门文章
微信扫一扫
分享到朋友圈AlphaGo 战胜了李世石,人工智能突破了围棋领域,这意味着什么? - 知乎533被浏览25884分享邀请回答8115 条评论分享收藏感谢收起272 条评论分享收藏感谢收起查看更多回答12 个回答被折叠()AlphaGO战胜了人类围棋顶尖高手,该害怕吗?
不知为什么,柯洁让我联想到了神剧《请回答1988》里的围棋天才崔泽,特别是他那一张手扶额头有些绝望的照片,颇叫人心疼。
这并不是一场人与人平等的较量,柯洁的对手是战绩赫赫的围棋人工智能AlphaGO,它早已在前些场世界级对抗中变得更为聪明,被世界级对手和各类世界竞赛的历史素材不断的训练训练再训练,这就是人工智能变聪明的“笨”方法。
人工智能看上去有着比人类更加强悍的思考能力,而这思考能力的基座其实就是对大数据的分析与处理能力。但大数据为什么叫“大”,是因为数据经常会存在于各个不同的系统,各个不同的场景甚至各个不同的地域。
大数据爆炸,跨平台、跨区域的数据使用场景越来越普遍。在这样的场景下带来的问题就是对应用系统的要求变得更高。一套应用系统连接两个或多个不同的数据源,会带来诸如数据库连接数增多、数据查询性能下降、不同数据源之间数据连接困难、应用层设计复杂等一系列的问题。
为数据融合解决方案中的分布式大数据网关Pylon,可以轻松解决这类问题。
如何处理跨平台、
跨区域的大数据?
拿某中央部委来举例,设有中央数据中心负责全局的数据应用,在各省分部均设有独立的数据中心,负责各省本地的数据应用,有三大常用的数据传输场景:
中央需要随时调用某几个省或者全国所有省数据
省与省之间数据相互调用
中央的数据下发至部分或者全部省份数据中心
传统的模式下需要在应用层做大量的设计开发工作,性能也会有较大的问题,特别是一些老的应用系统无法进行应用层与数据层修改的情况下,想做到跨数据中心的整合更是天方夜谭,而华为的分布式大数据网关Pylon可以轻松为客户解决这些问题。
数据集中调用
分布式大数据中心Pylon会在中央数据中心设置全局元数据库,在元数据库中保存所需要数据的目录,根据全局元数据来判定该查询需求的数据保存在哪些省的分数据中心,并将数据汇总整合并返回至应用查询结果。
跨中心查询
而在省与省之间,例如北京市需要调用广东省的数据时,通过分布式大数据网关的查询路由功能,直接从广东省的数据中心查询数据并将结果返回至北京市,省去了省与省之间再次建立网络与系统连接的麻烦,提升了数据调用的灵活性。
如果中央部委有某些数据要下发到某些省或者全国所有省份的时候,特别是一些流式文件需要实时同步给各分数据中心时,利用分布式大数据网关Pylon的流数据同步组件,可以高效快捷的完成这样的动作,而且不需要对应用层做任何改动。
如何应对大数据
双活多活容灾?
在某些重点行业的数据中心中,大数据已经占据了越来越重要的地位,有大量的Hbase、HDFS等大数据系统存在,而这些大数据在应用系统中的地位已经达到甚至超过了传统数据仓库,大数据系统为很多在线/离线分析系统、历史数据查询系统提供了强有力的技术支撑,但给数据中心的性能、安全性与可靠性也带来了新的挑战。
分布式大数据网关技术,可以提供很好的大数据双活多活容灾方案。举个例子,某企业在北京、深圳两地均有数据中心,在正常情况下,北方地区连接北京数据中心查询数据,南方地区连接深圳数据中心查询数据,一旦某个数据中心发生故障,则由正常工作的数据中心接管全部的应用。如果使用Hadoop自带的 DistCP功能做复制,只能使用定时循环复制,而且只能完全复制,无法做到增量复制,数据复制时延将达到小时级。而使用了分布式大数据网关Pylon后,带来了如下的改变:
采用事务触发的复制模式,一旦有新的数据写入,则马上复制到另一个数据中心,而且可以做到增量复制,这样则大大提高的不同数据中心间的复制性能与效率,数据复制时延减小到几分钟;
支持流式文件的复制,可以对时变化的日志等文件很好的复制;
在复制过程中提供不同粒度的状态监控,避免了DistCP在复制中途失败后只能再复制一遍的问题,性能、可靠性更好;
增加了优先级控制能力,改变了DistCP只能做到先进先出(FIFO)的方法,可以对不同数据源间设置优先级以及权重,管理更灵活。
我们的大数据覆盖范围已经在不断的晋级,能提供给人工智能自我学习的数据来源也不断扩展,也就意味着未来人工智能会愈加聪明,甚至可能像西部世界一样,粗暴的改变人类世界,该害怕吗?倒不妨积极的往前看,享受当下扫地机器人、社交机器人、医疗机器人等等,为我们带来的智能生活吧。
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点内容字号:
段落设置:
字体设置:
精准搜索请尝试:
深度揭秘:击败李世石后,AlphaGo的下一步是什么?
来源:作者:新智元责编:远洋
按:文章来自The Verge,由新智元原创翻译。【导读】击败围棋只不过是一个开始,AlphaGo的开发公司DeepMind在游戏、医疗、机器人以及手机方面都有规划。The Verge非常迅速地采访到了DeepMind的创始人Demis Hassabis,他说自己也被AlphaGo&咄咄逼人又胆大包天的下法惊呆了!在后面的采访中,Demis Hassabis透露了DeepMind的下一步。DeepMind大败围棋界传奇李世石,引发了对人工智能的潜力的关注——热度远超近期的任何事件。但是Google下属的AlphaGo项目并不是它唯一的计划——甚至不是最主要的计划。就像Deep Mind联合创始人Demis Hassabis在前几天说的那样,DeepMind想要“破解智能”,而关于如何达成这个目标,他有许多想法。Hassabis自己走的并不是寻常路,不过现在回顾起来似乎是最有意义的路。他小时候是一个象棋天才,在脑力奥林匹克运动会上5次获得Pentamind冠军,随后在不大的年龄就与英国电脑游戏开发工作室Bullfrog和Lionhead一起闯出了声名,致力于开发偏重AI的游戏(比如《主题公园(ThemePark)》和《黑与白(Black& White)》),之后他建立了自己的工作室Elixir。在2000年代中期,Hassabis离开了游戏行业,攻读神经科学Phd,并在之后的2010年联合创立了DeepMind。AlphaGo旗开得胜的第二天清早,Hassabis坐在了The Verge记者的面前。此刻,即使他的心思一点也没有留给媒体,也不会让人觉得奇怪。然而,他进入采访室时,言辞温和又让人愉快。他谈论了一会儿首尔四季酒店里闪耀的装潢,随后当一位Google发言人告诉他一夜之间韩国媒体界涌出了超过3300篇关于他的报道时,他看上去非常惊讶。“这简直难以置信,是吧?”他说道,“看着某种有点深奥的东西变得这么流行真是相当有趣。”除了AlphaGo,我们的访谈也聊到了视频游戏、次世代智能手机助手、DeepMind在Google中的角色、机器人、AI如何推动科研、以及其他的话题。深入——非常深度的谈话。|&围棋是人工智能的圣杯The Verge:对于不太懂AI或是围棋的人,你会如何谈论昨天发生的事引起的文化共鸣?Hassabis:我会有几件事想说。围棋一直以来都是完全信息博弈游戏(perfectinformation games)的巅峰。从可能性的角度来说,它比国际象棋复杂得多,所以在AI研究领域中它差不多算是圣杯,或者说重大挑战,特别是在“深蓝”(破解国际象棋)之后。你知道,虽然已经投入了很多努力,但我们还没有走到那么远的地方。蒙特卡洛树搜索在10年前是一个很大的创新,但是我觉得我们对AlphaGo做的是,引进了神经网络这种直觉层面的东西——如果你想这么称呼它的话——而直觉的确就是顶级围棋棋手间的差距。直播解棋时MichaelRedmond甚至一度难以点清目数,而他是一个职业九段!我对于这一点感到相当惊讶,这也向你显示了为围棋写一个评估函数(valuationfunction)是多么困难的一件事。The Verge:你有没有被AlphaGo的哪一步棋震惊到?Hassabis:当然。我们都惊呆了——我想李世石也是,从他的表情上来看——当AlphaGo在左侧落子深入李世石的领地时。我觉得这是相当出人意料的一步棋。The Verge:因为非常咄咄逼人?Hassabis:既咄咄逼人又胆大包天!并且,它是在用李世石的方式与他对弈。李世石以充满创造力的战斗方式而闻名,他也展示出了这一点,我们也预计到会有这样的情况发生。棋局一开始他就在整个棋盘上四处落子,没有真正停在哪一点经营局面。传统的围棋软件对于这种打法都不擅长,它们在局部计算上不算糟糕,但是当需要全局观的时候就不行了。The Verge:举办这些比赛,首先一个重要的目的是评估AlphaGo的能力,它能打赢还是会落败。你从昨天的比赛中看出了什么?Hassabis:我想,我们知道了我们沿着这个方向走到了超过——好吧,没有超过我们的预期,不过就像我们希望得那样远。我们原来告诉大家,我们觉得比赛的胜率五五开。我仍然觉得这可能是正确的说法,什么事都有可能发生,我也知道李世石再次面对AlphaGo的时候可能会采用不同的策略。所以我觉得结果会是非常有趣的。刚才说了AI的重要性,回答了你第一个问题。另一件我想说的重要的事情是AlphaGo和深蓝之间的区别。深蓝是一个人工打造的程序,程序员们从国际象棋大师那里获得信息、提炼出特定的规则和领悟,而我们为AlphaGO注入的是学习能力,随后它通过练习和研究学会围棋,这种做法更像人类。|&从游戏行业到DeepMindThe Verge:如果AlphaGo继续一路攻城略地,下一步会是什么——未来会不会有另一场AI参与游戏的赛事?Hassabis:我觉得对于完全信息博弈游戏来说,围棋已经是顶峰了。当然,还是有一些其它的顶尖围棋棋手可以让AlphaGo与之对弈的,但是游戏是没有了——无限制的扑克牌游戏非常困难,多人游戏有独特的挑战,因为它是一个不完全信息博弈游戏。然后,显而易见有许多视频游戏人类都玩得比计算机更好,比如《星际争霸》,另一个在韩国很火爆的游戏。策略游戏需要一种不完全信息世界中的高水平策略能力——这被称为“部分可观测”。对于围棋来说,显然你可以看到一切都显示在棋盘上,所以这让围棋对于计算机来说显得稍微简单了一点。The Verge:战胜《星际争霸》对你个人来说是一件让你感兴趣的事情吗?Hassabis:可能是吧。我们只对处在我们研究项目的主要轨迹上的东西感兴趣。所以DeepMind的目标不只是战胜游戏,虽然这的确很有趣也很让人兴奋。你知道,我个人很喜欢游戏,我曾经写过电脑游戏,但是这是因为它们作为测试平台来说非常有用,在这个平台上可以卸下我们对算法的想法、测试它们能做到什么地步;这是一种非常有效的方法。最终我们想要把这个东西用在重要的真实世界问题上。The Verge:1990年代后期,我在英国长大,从电脑杂志上看到你的名字与一些非常雄心勃勃的游戏联系在一起。后来当我第一次听说DeepMind、看到你的名字在里面的时候,我心想,“简直太配了”。你可以说说你是怎么从之前的游戏行业转到你现在做的事情上的吗?Hassabis:当然。像DeepMind这样的东西一直以来都是我的终极目标。我为此策划了超过20年,从某些方面来说。如果你回顾一下我做的一切,从最终我开始致力于AI研究来看,我的选择就变得非常清晰了。如果你很熟悉我在Bullfrog工作室的事情还有后来一些别的事,你就会知道,对于我所写的一切程序、我所参与的一切活动来说,AI是核心部分。显然PeterMolyneux(Bullfrog工作室的创始人之一)的游戏都是AI游戏。当我16还是17岁的时候,我在编写《主题公园》的程序,那对我来说是一段非常重要的时间,让我意识到了如果我们真的试图拓展AI的能力、它能强大到怎样的地步。我们卖出了数百万份《主题公园》的游戏,有那么多人都沉浸于玩这个游戏,这是因为游戏里的AI能够适应你玩游戏的方式、做出改变。我们在此基础上继续前进,我也试图在我接下来的游戏生涯中继续往这个方向开拓。后来我离开了游戏行业,回到学术圈和神经科学界,因为我在2000年代中期感到我们在AI研究方面已经做到了极限——当你还需要真的做出一款游戏的时候。AI研究难以继续深入,因为发行商们只想要游戏,是吧?The Verge:所以那时只是因为AI最显而易见的应用就是游戏吗?Hassabis:当然,我是这么觉得的,我也确实认为我们当时做的AI极为前沿、让人几乎难以相信。我觉得1990年代学术圈还没有什么动静,而这些新技术——神经网络、深度学习、强化学习——也还没有真正得到推广。所以事实上那时候最好的AI在游戏行业。那不是我们现在致力于研究的这种AI,它更像是有限状态机(finite-statemachines),但是相当复杂、也能自我适应。《黑与白》之类的游戏中有强化学习——我仍然觉得这是强化学习用在游戏中的最复杂的一个例子。但是,随后在2004年、2005年左右的时候,很明显游戏行业走的路线与90年代不同了——90年代时它非常有趣也非常有创造力,你可以想出任何主意、然后实现它。但它后来变得更多的是在依赖于画质、续作、还有FIFA足球游戏等等,不再那么有趣了——我在游戏方面做了我能做的一切,是时候为了DeepMind的建立而去收集不同的信息了。那就是神经科学。我想要从大脑如何解决问题中获得灵感,那么还有比攻读一个神经科学博士学位更好的方法吗?The Verge:这可能看上去是唾手可得的成果,不过如果你们现在将AI的进展应用到游戏上,会怎么样?Hassabis:我觉得应该会真的很惊人。最近EA有人联系过我…【渴望的语气】我们应该会做的。有那么多事情可以做!【笑声】使用这些技术是非常通用的,我很想要做这件事。但是有带宽的限制在,并且我们现在精力集中在医疗和推荐系统之类的方面上。不过可能到某个时间我们就会做这件事,制作一些智能的、有适应能力的AI对手,并且我觉得游戏开发者们也会喜欢这样的——不必再为每个游戏都开发新的AI——届时可能他们只需要通过他们的游戏训练出一个AI就好了。The Verge:我刚才想象了一下你在家打视频游戏,在NPC面前比我还要疲于奔命的样子。Hassabis:当然【笑声】是的,在MMG(大型多人游戏)和类似游戏里这总是让我很受挫。我从来没有真的为这些游戏着迷,因为NPC都太蠢了。他们没有记忆,不会改变,不理解上下文。我觉得如果有了这种可以学习的AI,游戏就完全上升到另一个层次了。|&DeepMind的下一步:医疗The Verge:这周你带来的消息里,AI未来主要的用途是医疗、智能手机助手以及机器人。让我们来详细聊聊。医疗方面,举例来说,IBM的Watson在癌症诊断方面有所建树——DeepMind可以带来什么?Hassabis:好吧,现在还只是雏形。我们几周前宣布了一项与NHS(英国国家医疗服务体系)的合作,不过这只是刚开始着手建立一个利用机器学习力量的平台。我觉得Watson与我们做的事情非常不同,从我的理解而言——Watson更像是一个专家系统,所以它是另一种形式的AI。我觉得你能看到这类AI做的事情会是医疗图像的诊断,然后可能有对于自我量化(quantifiedself)或是重要迹象的长期追踪,帮助人们有更健康的生活状态。我觉得这很适合用强化学习。The Verge:在与NHS的合作中,你们推出了一款看上去没有怎么用到AI或是机器学习的app。这背后你们是怎么想的?为什么NHS要用这个app,而不是其他厂商推出的软件?Hassabis:NHS的软件在我的理解中是相当糟糕的一个东西,所以我觉得第一步就是试着让它进入21世纪。它们并不是移动端的,完全不是我们作为今天的消费者理所当然认为能看到的那种样子。并且我觉得对于医生和护士来说它用起来让人觉得很挫败,降低了他们的效率。所以我觉得第一步是,帮助他们用上更有用的工具,比如可视化和基础统计信息。我们认为,我们会实现这样的功能,然后看清我们到底需要什么,随后再将更纯熟的机器学习技术运用其中。The Verge:这一切有多简单?医疗资金在英国显然会是一个充满争议的话题。Hassabis:当然,呃,好吧,我们正在免费做这件事【笑声】这让它变得很简单!这与大部分软件公司都有很大的不同。大部分时候是大型跨国公司制作这种软件,所以他们不会真正把注意力放到用户身上,而我们在设计它的时候更像是一种初创企业的方式,从用户那里倾听反馈、从某种程度上来说与他们一起设计一个软件。|&未来的核心:智能手机助手The Verge:那么让我们谈谈智能手机助手。我看到你第一天的时候演讲PPT里有一张图来自电影《她(Her)》——这会是最终形态吗?Hassabis:不,我的意思是,关于智能手机助手是什么样,《她》只是一种盛行的主流观点。我只是觉得,我们会想要让这些智能手机助手之类的东西真正变得智能、理解上下文、对于你要做什么有更深的理解。现在,大部分这样的系统都极为脆弱——一旦你偏离了预先编程输入的模板,它们就完全变得毫无用处。所以这意味着让它们变得真正可以适应、变得灵活、也更稳健。The Verge:为了改善这些,需要有什么突破?Hassabis:我们可以的,只不过我觉得你需要一个不同的方法。再说一次,这是预编程和学习的二分法。目前基本所有的智能手机助手都属于特殊案例和预编程的,这意味着它们很脆弱,因为只能做预编程写好的事。然而真实的世界非常混乱,用户们也会在你无法提前知晓的情况下,做着不可预知的事情。我们对DeepMind的信念是,这也是最根本的原则,通往人工智能的唯一道路,是从地基开始打起,而且变得通用。The Verge:AlphaGo从学习很多游戏模式过程中顺利起飞,这对于智能手机怎么使用呢?它的输入是如此的多变?Hassabis:是啊,所有得有上万吨的数据,而你可以从中学习到很多东西。事实上,AlphaGo的算法,我们打算在未来几个月尝试的是,摆脱监督式学习的出发点,让它完全自我发挥,从一无所有的状态开始。它会需要更长的时间,因为当你采用随机方法的时候,其中的审查和错误会需要更多的时间训练,也许是几个月。但是,我们认为有这个可能性,让它从纯粹的学习中起步。The Verge:是因为算法现在能达到的程度,所以你认为这是可能的么?Hassabis:不是的,我们本来可以这样做的。它不会使得程序更强大,它只是做着纯粹的学习。所以会有一些非监督的部分。我们认为这个算法能够在非监督的状态下工作。我们去年做了Atari游戏,在像素的层面玩游戏,而不会受人类知识的禁锢,它会在屏幕中做一些随机的动作,开始游戏。The Verge:对于Atari游戏来说更加容易,是因为失败的状态更加明显么?Hassabis:的确更加容易,因为分数更有规律。在围棋中,不管最终赢得还是输掉比赛,你也仅仅得到一个分数。这就是所谓的信用分配问题(Credit Assignment Problem):这个问题是,你在围棋中走了几百步,但不知道具体哪一步会为最终的胜利或失败负责,其中的信号非常微弱。而在大多数的Atari游戏中,所做的大多数事情都会给予分数,所以就得到了更多的面包(奖励)去仿效。The Verge:你可以给个是时间表么?当这些事情开始给手机市场带来显著性差异的时候。Hassabis:我认为在未来的两到三年会开始看到它。我的意思是,它在开始的时候是非常微小的,只有很小的部分会工作的更好。也许在未来的4到5年,甚至5年更多,你可以看到在功能上大的变化。|&为何&Google的支持非常重要The Verge:你确定了未来各种各样的可能性,而这件事是和Google联系在一起最明显的事情。Hassabis:是的。The Verge:你有没有得到任何指示,这些事情被期待如何纳入到Google的产品路线图或商业模式中?Hassabis:不,在如何最优化研究进展方面,我们有很强的主导权。这是我们的使命,也是为什么我们加入了Google,这样我们可以给研究进行涡轮增压。这是发生在过去几年的事情。当然,我们实际上也致力于很多Google内部的产品,但是他们是非常早期的阶段,所以还没准备好公布。当然我认为智能手机助手是非常核心的,我认为Sundar Pichai已经对此谈了很多,这是Google未来的核心。The Verge:Google有另外的举措,例如Google Brain,它推出了机器学习的特征,像Google&图片搜索和其他面向用户的东西。Hassabis:是的,几乎无所不在。The Verge:你的公司和Google Brain有互动吗?你们有没有重叠的部分?Hassabis:当然,其实我们是非常互补的。我们每周都有交谈。Google Brain主要致力于深度学习,他们也有非常卓越的工程师Jeff Dean,所以他们已经铺开到公司的各个角落,这也是为什么我们发明出了令人惊喜的Google图片搜索。他们正在做着现象级的工作。另外,他们的团队在山景城,所以他们离产品团队更近,他们的研究周期也更像12到18个月。而我们有更多算法开发的工作,我们倾向于为需要两三年研究的事情做研究,而且不需要在开始的时候就有直接的产品焦点。The Verge:Google对AlphaGo的支持有多重要?如果没有他们,你们是否能做到?Hassabis:这是非常重要的。AlphaGo在比赛中实际上并没有使用那么多硬件,但我们需要大量的硬件来训练它,做各种不同的版本,并让他们在云端互相比赛。这需要相当多的硬件才能高效完成,所以如果没有这些资源,在这段时间内根本无法完成。|&不看机器人,关注科学的进展The Verge:让我们来说说机器人。我平时在日本,并倾向于认为日本是机器人的精神家园。我现在在日本看到的机器人以两种方式使用。我们有像发那科这样的工业机器人,有一个确定的目的做着让人惊讶的事情,也有像软银Pepper那样的迎宾机器人,尽管使用有很大的限制,但他们在很多方面都是野心勃勃。对于这个领域现在的状态,你有什么想法?Hassabis:是的,我认为你说的发那科,他们有很漂亮、很能干的身体,但缺少了智慧。而迎宾机器人和智能手机助手更像,我见过的那些,反正都是预编程了很多针对模板的反应,但如果你做一些其他事情,例如去越野的地方滑雪,那他们会感到很困惑。The Verge:所以我猜测,一个很明显的问题是,机器学习会如何强化机器人的能力。Hassabis:是的,这是完全不同的方法。你可以从头开始建立学习新事物,并能应对突发事务的能力,我认为这就是当机器人或软件应用程序在真实世界中和用户交互时所需要的——他们需要拥有这种能力,并妥善使用。我认为学习曲线最终必须采用正确的做法。The Verge:对于可学习的机器人来说,什么是你看到的最直接使用案例?Hassabis:其实,我们对此没有太多的想法。显然,自动驾驶汽车是一种机器人,但目前来说还是狭义的人工智能,虽然他们使用了计算机视觉里面一些可学习的人工智能——特斯拉采用了一种基于深度学习的标准、现场的计算机视觉方案。我相信日本在老年护理机器人、家庭清洁机器人上面有很多思考,我认为这对社会会非常有用。特别是在一个人口老龄化的社会里,我认为是一个非常紧迫的问题。The Verge:为什么在这些类型的案例中,一个更基础的学习方法,能带来如此显著的提高呢?Hassabis:那么,你需要思考这样的问题:“为什么我们还没有拥有这些东西?”为什么我们没有一个机器人,可以跟在你后面清理房子?原因在于,每个人的房子在布局、家具等方面有很多的不同,有时候它是混乱的,有时候却很干净。因此,很难通过预编程的方法,找到整理你的房子的解决方案,对吧?而且你还得考虑,你的个人偏好,例如你会喜欢衣服怎样被折叠。这真的是非常复杂的问题。我们认为,这些事情对于人类来说很简单,但实际上我们必须处理非常复杂的事情。The Verge:出于个人兴趣问一下,你有机器人吸尘器吗?Hassabis:额,我的确有一个,但是它不怎么管用所以…(笑)The Verge:我也有一个机器人吸尘器,它不是非常管用,但我发现自己能学习它奇怪的地方,并围绕它工作,因为我是一个懒人,而它带来的好处值得我这么做。所以我想知道,我们什么时候能有更先进的机器人,在“足够好”的引爆点到来之前?我们会在有意义的达到人类水平的交互和围绕这个奇怪的小玩意工作之前,就停止研发吗?Hassabis:是的,我的意思是,也许吧。我想每个人都会以合理的价格购买一个机器人,它可以叠好盘子,并清洗干净——这些哑巴吸尘器非常受欢迎,但无论如何,他们并没有真正的智能。所以,我觉得其中的每一步,逐步的的进展,就会发明出有用的东西。The Verge:那么,你对人类、机器人和人工智能在未来的交互,有什么遥远的期望?显然,人们的脑袋能到达那些非常狂热的科幻地方。Hassabis:我自己对机器人没多少思考。我自己对人工智能的使用感到兴奋的领域是科学,能够推动它更快的发展。我想看到人工智能辅助的科学,那样会有一个人工智能研究助手,它可以做很多乏味的工作,阅读有趣的论文,从海量的数据中找到结构,并把它们呈现到人类专家和科学家面前,以实现更快的技术突破。我几个月前在欧洲核子研究中心做演讲,很显然它们创造出比地球上任何地方都多的数据,我们都知道在它们海量的硬盘中,可能会有某个新的粒子发现,但没有人能抽出时间做这件事情,因为这里的确有太大了的数据了。所以我觉得,如果有一天人工智能参与寻找到一个新的粒子,那么是一件非常酷的事。注:以上图片均来自译文。
软媒旗下软件:
IT之家,软媒旗下科技门户网站 - 爱科技,爱这里。
Copyright (C) , All Rights Reserved.
版权所有 鲁ICP备号

我要回帖

更多关于 围棋李世石与alphago 的文章

 

随机推荐