万花镜
    首页社会国际娱乐科技时尚军事汽车探索美食旅游历史健康育儿
    电影电脑工业设计亚洲日本东亚首都金融

    腾讯“绝艺”9连胜横扫日韩AI,距世界冠军一步之遥

    2017年3月19日 作者:新智元

    新智元报道

    作者:张易 弗格森

    2017 新智元开源·生态 AI 技术峰会 【倒计时 8 天,点击“阅读原文”抢票中国 AI 2017 开年盛典启幕在即,三大亮点不容错过:① 两会聚齐 BAT 人工智能技术领袖,洞察中国 AI 军团布局;② 引爆 AI 原力,现场参与 AI 技术论坛顶牛对撞;③人工智能创业家巨星璀璨,看投资领袖预测谁将成为中国 AI 独角兽

    【新智元导读】刚刚拿下对战平台首个“10段”的腾讯围棋AI 绝艺 正在日本参加“机机大战”,首日比赛中,绝艺横扫一众对手,包括最受关注的日本 AI Zen,拿下7连胜。AlphoGo之后,计算机围棋大战似乎“历史使命”已经完成,一年以来,AI 在围棋上有哪些进展,中国在这方面的研究处于处于什么水平?正在进行的UEC杯也许能给我们答案。另外,绝艺目前正在冲击最后的冠军宝座,可火速围观。

    没有AlphaGo的日子里,中国的“绝艺”成了围棋AI的王者。这位刚刚晋升为首个网络对战平台“十段”的人工智能棋手,正在日本参加第10届UEC杯世界计算机围棋大赛。参赛者全部是来自世界各地的围棋AI高手。

    在3月18日的首日比赛中,绝艺相当轻松地横扫7位对手,其中包括被认为是AlphaGo横空出世前最成功的围棋AI——来自法国的疯石(Crazy Stone),以及上届冠军DeepZenGo。目前绝艺以全胜的成绩在预选赛中排名第一,今天将参加淘汰赛。以绝艺目前展现出的实力来看,拿下本届UEC杯的冠军的可能性非常大。

    最新消息显示,绝艺在今天早上开始的淘汰赛中已经连赢两场,只需要再赢两场便能问鼎最后的冠军。但是,进入淘汰赛最后阶段的队伍实力不容小觑,绝艺想拿下最后的冠军依然有不小的考验。

    本届UEC杯比赛共有A组16个围棋AI、B组14个围棋AI争夺冠军。比赛共进行两天,赛制为每方半小时包干,尽显围棋AI在计算速度上的自信。3月18日是预赛,共进行七轮角逐,按照积分选取前十六名进入3月19日的淘汰赛。淘汰赛以单败淘汰的赛制进行四轮角逐,决出最后的冠军。冠军和亚军如果出自A组,则将于3月29日迎战人类选手——就是“电圣战”。

    绝艺属于A组。本届比赛的人类选手是来自日本的七段Ryo Ichiriki。在2013年首届电圣战中,疯石击败了曾蝉联五届日本冠军的职业围棋手石田芳夫。不过当时石田已过盛年,而且还让了疯石几子。因此这场比赛没有AlphaGo对战李世石那样意义深远引人注目。

    UEC杯可能是最后一届,AlphaGo的出现让其失去意义

    UEC杯由日本电气通信大学于2007年创办,是世界权威的计算机围棋大赛。在AlphaGo空袭围棋之前,UEC杯承载着计算机攻克围棋项目的使命,大赛上活跃着Zen(DeepZenGo的前身)、疯石、银星、石子旋风等明星程序,直到2015年第8届UEC杯,上述程序依然未能完全攻克职业棋手的四子关,即职业棋手只有让四子以上,AI才有机会获胜。

    2015包括Zen的开发者在内的加藤英树等畅所欲言,认为计算机攻克围棋至少还需要十年时间,亟须算法上的突破。摆脱对蒙特卡洛算法的依赖,神经网络可能是突破的方向。不过2016年, AlphaGo的横空出世,彻底改变了这一格局,2016年三月份4:1大胜李世石之后,AlphaGo升级版Master 又在2017年1月以50比0的打比方横扫人类棋手。彻底奠定了对人类专业棋手的领先优势。

    UEC杯其实已经已失去了其“历史使命”。

    所以,本届参赛AI“石子旋风”的开发者林在范(韩国)说,第10届UEC杯可能是这项赛事的最后一届比赛,再继续办下去已没有什么意义。林在范说,他的“石子旋风”参加第10届比赛,只因最后一届有纪念意义。

    腾讯绝艺与DeepZenGo的宿命对决

    中国绝艺大战日本DeepZenGo

    不过,这届比赛仍有一些看点。其中一个焦点便是DeepZenGo和中国的“绝艺”的PK。

    绝艺经过一年多的学习,已经成为网络上第一个10段棋手,并且曾经战胜过柯洁等世界冠军。

    据林在范介绍,第10届比赛最大明星是DeepZenGo和中国的“绝艺”,这两款计算机围棋程序已经达到了超一流职业棋手的水准。其他计算机程序,包括“石子旋风”、法国“疯石”等不少程序基本都达到了网络9段的实力。

    18日的预选赛中,绝艺首先轻取了来自日本的两个围棋AI。其中第二场的对手naiver1的“填子大法”令观者大跌眼镜,完全像一个初学者进行对弈,被绝艺杀得全局没有一块活棋。有网友调侃道:这对局者的棋力差异,比我和李世石的差距还大。好戏从第三场开始,法国里尔第三大学(Université Lille 3)的计算机科学教授Rémi Coulom独自研制的疯石(第1、2、6、8届UEC杯冠军)给绝艺制造了一些麻烦,且体现出了布局上的巧思,但行至中盘,大公司和个人开发在计算力上的差距就显现了出来。疯石因为计算力薄弱,一杀就死,最终中盘认输。不过从及时认输这一点上,也能看出疯石相较于前面的对手更加智能。

    在又连胜了三个日本AI棋手后,绝艺终于迎来了“宿命”中的对手——DeepZenGo。由日本东京大学研发、以超越AlphaGo为目标的DeepZenGo,在AlphaGo升级版——Master碾压世界顶级职业高手、豪取60连胜时,一直也在围棋网络平台上对战9D高手,不停训练,不停涨棋,9天时间对弈了300多盘,胜率达到90%。

    得益于腾讯强大的计算资源,绝艺迅速崛起

    DeepZenGo的作者之一尾岛阳儿曾经说过,Zen的蒙特卡洛树搜索(MCTS)以及一些其他的部分是优于AlphaGo的,因为AlphaGo两位主要的作者的程序Erica和RLGO在计算机围棋比赛上都比不过Zen(日本)和Crazystone(法国)。

    但他也表示,因为用大量棋谱训练深度卷积神经网络(DCNN)需要异常强大的计算机硬件,而他们手上并没有这种条件。AlphaGo有1920个CPU、280个GPU,而DeepZenGo据说是44个CPU,4个GPU。在CPU上差了43倍,在GPU上差了70倍。在计算力与搜索深度上完全是天壤之别。

    在和绝艺的比赛过程中,DeepZenGo果然体现出硬件配置不足导致的计算能力薄弱的问题,在左下角首先出现误算,大块棋筋被执白的绝艺无条件杀掉,随后在右上角遭遇重创,最终中盘不敌绝艺。

    纵观和绝艺比赛的各Al,普遍输于计算力薄弱,且大多都有填子、送吃的情况。而反观绝艺,它的背后是腾讯强大的资源和技术实力,从诞生之初就有“国产AlphaGo”的称号。有知乎网友曾评论:当前的绝艺应该相当于对战李世石的V18版,而其他公开见到的大多只有赢樊麾的V13的水平,DeepZenGo强一些,但从跟赵志勋的对战来看肯定不如V18。

    同时,本届UEC杯对硬件配置也没有强制性要求,虽然要求参赛者必须报告机器功耗,但特别说明1000W以上的,可以通过特别许可。我们目前还不太清楚此次参赛的绝艺的硬件配置,但从之前野狐网一段时间内绝艺多个版本轮番测试的情况来看,腾讯在这方面无疑是花费了心思的。

    DeepZenGo此前被认为相比于AlphaGo,最大的劣势之一是它是单机版的。本次比赛对参赛AI是单机作战还是联网没有限制。主办方提供服务器和以太网接口,参赛者将自己的机器接入选定接口进行对局,IP由DHCP自动分配。也就是说虽然不能远程接入服务器参赛,但只要机器到达现场,通过现场单机转接服务器是不禁止的。不知道这次DeepZenGo是否还是单机作战,但这对于绝艺来说无疑是利好消息。

    AlphaGo转型,计算机下围棋意义何在?

    棋类AI最早基本都是基于蒙特卡洛树搜索(Monte Calro Tree Search, MCTS)来构建的,诸如Crazay Stone、DeepZenGo这样的围棋AI也不例外。研发者“将游戏中所有的可能性表示成一棵树,树的第N层就代表着游戏中的第N步。树的node数是随着树的深度成指数增长的,不考虑剪枝,每个node都需要进行估值。”

    新智元在去年AlphaG与李世石的人机大战时曾介绍过,围棋属于所有完全信息(perfect information)博弈。所有完全信息(perfect information)博弈都有一个最优值函数(optimalvalue function),它决定了在所有参与博弈的玩家都做出了完美表现的情况下,博弈的结果是什么:无论你在棋盘的哪个位置落子(或者说是状态s)。这些博弈游戏是可能通过在含有大约个可能行动序列(其中b是博弈的宽度,也就是在每个位置能够移动的步数,而d是博弈的深度)的搜索树(search tree)上反复计算最优值函数来解决的。在象棋和围棋之类的大型博弈游戏中,穷尽地搜索是不合适的,但是有效搜索空间是可以通过2种普遍规则得到降低的。首先,搜索的深度可能通过位置估计(position evaluation)来降低:在状态s时截取搜索树,将随后的子树部分(subtree)替换为根据状态s来预测结果的近似的值函数。这种方法使程序在象棋、跳棋、翻转棋(Othello)的游戏中表现超越了人类,但人们认为它无法应用于围棋,因为围棋极其复杂。其次,搜索的宽度可能通过从策略概率——一种在位置s时表示出所有可能的行动的概率分布——中抽样行动来降低。比如,蒙特卡洛法通过从策略概率p中为博弈游戏双方抽样长序列的行动来让搜索达到深度的极限、没有任何分支树。将这些模拟结果进行平均,能够提供有效的位置估计,让程序在西洋双陆棋(backgammon)和拼字棋(Scrabble)的游戏中展现出超越人类的表现,在围棋方面也能达到低级业余爱好者水平。

    “就在MCTS的发展似乎也要山穷水尽的时候,深度学习的发展让AlphaGo横空出世。但是仔细想想又不算是横空出世,Alphago的第一作者正是十年前最强的围棋程序CrazyStone的作者,是为MCTS发展做出了贡献的Coulom的学生,David Silver也是早在10年前就开始将强化学习运用在MoGo等程序中。可谓十年磨一剑。”

    AlphaGo 给围棋带来了新方法,它背后主要的方法是Value Networks(价值网络)和 Policy Networks(策略网络),其中Value Networks 评估棋盘位置,Policy Networks 选择下棋步法。这些神经网络模型通过一种新的方法训练,结合人类专家比赛中学到的监督学习,以及在自己和自己下棋(Self-Play)中学到强化学习。这不需要任何前瞻式的 Lookahead Search,神经网络玩围棋游戏的能力,就达到了最先进的蒙特卡洛树搜索算法的级别(这种算法模拟了上千种随机自己和自己下棋的结果)。同时AlphaGo也引入了一种新搜索算法,这种算法将蒙特卡洛模拟和价值、策略网络结合起来。

    AlphaGo之后,Crazy Stone、DeepZenGo等纷纷在自己的程序中加入了深度学习模块。最新推出的绝艺当然更是直接站在了巨人的肩膀上。深度学习之于围棋AI,就像是左右手互博。学习时间越长,也就是互博时间越长,AI的棋力就越强。以此为前提,绝艺的大公司背景能够保证其拥有比对手更多的训练数据和更强的计算能力,横扫UEC也就在情理之中了。

    2017年年初,AlphaGo升级版在网上对弈比赛中取得对人类棋手的全胜以后,曾经传出“不再下棋”的传言。不过也有消息称,今年4月,DeepMind 的围棋AI 程序将和世界第一柯洁进行一场终极PK。

    DeepMind的最终目标是开发通用的人工智能,从去年3月横空出世的AlphaGo到今年年初的Master,DeepMind 在围棋上的探索目的现在看来已经基本达到。从去年新闻报道DeepMind 用深度学习改进谷歌数据中心数据消耗,到今年频频发力智能医疗,DeepMind肯定不希望AlphaGo只是一只会下棋的“狗”。

    不论如何,也许这真的是最后一届UEC了。AlphaGo虽然不是直接诞生于此,但是围棋AI数十年的发展,无疑从人才、技术、思想方法等多方面滋养了AlphaGo诞生的土壤。

    如今,“国产AlphaGo”横扫UEC,围棋AI已经成为这一古老人类游戏的大魔王级玩家,而围棋AI的发展,又在反哺深度学习等人工智能技术的茁壮成长。在新智元昨天的头条文章中,我们特别介绍了AlphaGo的创造者DeepMind这一年来在人工智能的社会应用方面所做的工作。围棋AI的发展,确实攻破了人类最后的智慧堡垒,但它仍然是人类挑战自我极限和共同建设更美好社会之决心的佐证。

    8天之后,北京,一场汇聚中国产业界领袖的大型峰会——新智元AI技术2017开源·生态技术峰会即将举行。腾讯、百度和阿里的AI 技术负责人现场开讲,想了解更多前沿的 AI 资讯,点击阅读原文抢票~

    新智元“3·27”AI 技术峰会购票二维码:

    位置:首页 > 科技
    加载更多评论...
    本类推荐
    趣谈两代围棋主播
    趣谈两代围棋主播

    人生最重要的:不是努力,不是奋斗,而是抉择。当你走到人生十字路口,不知道如何选择,停下来,听一听宝宝老师的围棋文化讲座。这一回,我们讲的是围棋节目主持人。说到围棋主持,老师脑海里的第一印象是程晓流六段...

    棋手的婚礼:除了围棋,我还有你
    棋手的婚礼:除了围棋,我还有你

    22日下午,微博@棋牌新闻放出韩国职业棋手赵汉乘的结婚照两张大家纷纷评论说这对新郎新娘很是养眼来看看其他围棋选手的结婚照吧1中韩第一对“围棋夫妻”——4月17日,韩国人传统的成婚吉日,很多新人都会选择在这一天举行婚礼。

    率性95后柯洁:用“吹牛”提高围棋赛收视率
    率性95后柯洁:用“吹牛”提高围棋赛收视率

    1月5日,在江苏如皋举行的第二届Mlily梦百合杯决赛第五局中,年仅18岁的柯洁九段执黑3/4子险胜14个世界冠军获得者、韩国的 李世石九段,以3比2的总比分夺冠——自2015年1月以来,柯洁连夺百灵杯、三星杯、Mlily梦百合杯三项世界冠军...

    “世界最强棋士战”最终轮人机战回顾
    “世界最强棋士战”最终轮人机战回顾

    本文来源:微信号——弈道秋声,作者萧萧风随着DeepZenGo连续终盘“发疯”而惨遭两连败,本次世界最强棋士决定战的冠军注定属于人类棋手。不过从“人机大战”的角度看,最后一轮DeepZenGo的表现仍是焦点。

    腾讯“绝艺”全胜战绩夺世界围棋AI冠军,曾对柯洁13连胜
    腾讯“绝艺”全胜战绩夺世界围棋AI冠军,曾对柯洁13连胜

    3月19日,第10届日本UEC杯计算机围棋大赛在日本东京都日本电气通信大学(UEC)落幕,腾讯人工智能实验室(腾讯AI Lab)研发的围棋人工智能程序“绝艺”(英文名:FineArt) 在最终的决赛中,战胜了日本“棋手”DeepZenGO,以11战全胜战绩获得这次比赛冠军。

    围棋AI大潮袭来中日韩三英首当其冲将战DeepZenGo
    围棋AI大潮袭来中日韩三英首当其冲将战DeepZenGo

    朴廷桓(左)、芈昱廷(中)、井山裕太(右)将分别代表中日韩参赛,围攻DeepZenGo日本举办新世界大赛中日韩棋手将与ZEN共同出战日本将在2017年3月21-24日在大阪市日本棋院关西本部举办“人工智能”和人类平等竞技的“世界围棋精英赛”...

    柯洁也晋升围棋10段,但一场也没跟AI交手(都跑去日本了)
    柯洁也晋升围棋10段,但一场也没跟AI交手(都跑去日本了)

    感谢换了昵称的群友68chvrltcmr舒石 发自 凹非寺量子位·QbitAI 报道继腾讯绝艺之后,昨天在腾讯野狐上诞生了第二个围棋10段。这个人,毫无意外,就是现实世界的人类围棋第一人:柯洁……恭喜柯洁老师。

    第61届欧洲围棋大会:7.22-8.7我们德国见!
    第61届欧洲围棋大会:7.22-8.7我们德国见!

    European Go Federation(简称EGF),这是一个完全公益性的民间组织,在欧洲已经拥有38个会员国。与其他围棋比赛不太一样,欧洲围棋大会虽然也有正式比赛贯穿始终,但更为吸引人的是穿插其中的各种欢乐赛。

    聊聊中日韩三国哪方围棋水平更高,谁是最强棋手
    聊聊中日韩三国哪方围棋水平更高,谁是最强棋手

    (图示为李世石在围棋人机对战发布会)备受瞩目的围棋“人机大战”将于9日上演,“除了以5比0战胜它外,其他没有意义。”李世石接受采访时自信满满,认为人的创造力是相对于机器的一大优点。(图示为电脑“深蓝”与国际象棋大师卡斯帕罗夫对弈)对于在棋类运动中...

    看围棋人机大战听美女唐奕解说
    看围棋人机大战听美女唐奕解说

    这些天,上海姑娘唐奕更忙了。明日谷歌人工智能AlphaGo五番棋大战人类智慧李世石,“脑战”,即将轰轰烈烈打响。腾讯新闻客户端全程直播,职业二段唐奕是解说嘉宾。圈里圈外提到唐奕,总会贴上“美女”这个形容词。

    执黑的“地震狗”回归正常完胜井山人工智能当开拓围棋新天地
    执黑的“地震狗”回归正常完胜井山人工智能当开拓围棋新天地

    这个栏目我们将每天推出最新的大赛棋局,也会为棋友们奉上经典的历史名局。在动态的棋谱中随时随地感受围棋大师们精妙的构思、深邃的计算,不亦乐乎!随着DeepZenGo连续终盘“发疯”而惨遭两连败,本次世界最强棋士决定战的冠军注定属于人类棋手。

    世界计算机围棋赛中国绝艺11连胜夺冠两胜日本天顶
    世界计算机围棋赛中国绝艺11连胜夺冠两胜日本天顶

    3月19日,第10届UEC杯世界计算机围棋赛在东京落幕,来自中国的“绝艺”在决赛击败日本开发的“DeepZenGo”(天顶),以11战全胜的战绩成为“末代冠军”,打破了“DeepZenGo”与韩国程序“石子旋风”对赛事冠军的垄断。

    延伸热词
    首页社会国际娱乐科技时尚军事汽车探索美食旅游历史健康育儿
    万花镜 版权所有 京ICP备14059027号
    值班QQ:3012642954
    邮箱:wanhuajingnews@qq.com