古典的胜利
Alphago(阿尔法围棋) 赢了第一盘之后,作为一个守在电脑前两三个小时,同时打开弈城围棋直播对局室和两个视频直播网站的围棋爱好者,令我震惊的,不是所谓机器的胜利,而是国人左右摇摆和见风使舵的天性。不管是高段位职业棋手,还是业余看热闹的,大多数棋评者对棋局优劣乃至人机优劣的判断,竟可以随时发生质的改变。这种改变的轻易和毫无障碍,让我有一种感觉,他们做出的每一次判断并非出于深思熟虑,或者说,他们并不想花时间全面斟酌现状,而只是依靠各自的成见,浮泛的表面,以及群众的意见。
比如说白80的长,几乎立刻引发一片哀叹和讥嘲,认为是只有机器才会走出来的大缓着,但单纯看这一手,多么像李昌镐的棋风;又比如黑93之后形成的巨大中空,确实很大,但这毕竟只是一块精华已尽的后手棋,并且黑棋只有这么一块大棋,而此刻白棋拥有先手,并在其他几处都有成大空的潜力,我不明白为什么观棋者们都对此视若无睹,都摆出一副黑棋赢定的样子。当时盘面的基本感觉,如果不带任何偏见,至少是还可以接着下下去的棋才是,而事后谷歌工程师给出的答案也是如此,Alphago一直觉得局面占优。围棋上有一句话,叫做“想赢一盘棋不容易,想输一盘棋也不容易”,这是每个业余段位的围棋爱好者都明白的道理,但在这天下午,至少是有很多应邀讲棋的职业棋手都陷入了一种浮躁与迷狂之中。他们在插科打诨,在匆促判断,在调笑机器,而在YouTube上,迈克·雷蒙却认真地在一步步摆着各种变化的棋型。
Alphago在这盘棋上的表现一直都不差,这盘棋的总体质量也不差,差的是我们这些看客前倨后恭的表现。我们对待Alphago仿佛一个老大帝国对待一个年轻的入侵者,在无端的傲慢之后又迅速走向无端的臣服。
这些年,围棋比赛越来越多,中国年轻棋手的战绩也越来越好,但棋局的质量却未必能胜过从前。所谓“争棋无名局”,这当然是常识,但围棋比赛最后慢慢变成一个拼体力、搏失误、赌昏招的野蛮粗暴的竞技运动,却不能不说是和年轻一代棋手“胜者为王”的整体培养机制有关。过去聂卫平号称前五十手天下无敌,也就是说,他的整体盘感非常强,可后来年轻棋手对付老聂的办法就是,不按常理出棋,把局面搅浑,让你陷入大量的计算当中,最后一招出错前功尽弃。因为再优势的局面,要转变成胜势,都要依靠复杂的计算,这种复杂的计算消耗大量脑力,而每一步变化之后,即便是非常无理的变化,也一定会带来新一波的大量计算,倘若单拼这一点,再加上限时,一定是年轻人胜过年长者。老聂一辈棋手一开始极不服气,但输惯了之后,竟然也就默认了年轻人的强大。过去日本棋手讲究棋型,讲究美感和均衡感,宁可输棋也不走愚形,已经变成中韩年轻棋手的笑谈,他们是再难看的棋也可以走出来,只要有效,这种有效包括有效地激怒对方,令对方发挥失常。
但这一切,这最近一二十年中韩年轻棋手在气势上压垮对方并等待对手犯错误的赢棋心理,在Alphago面前就显得非常可笑了。打个比方,这些年很多围棋大赛上的对局更像是两个鸡蛋硬碰硬,拼的是双方自身的最薄弱环节,也就是人力无法穷尽的计算和人必然会遭遇的心理波动,但现在和Alphago对局,如果还在这方面拼,那不啻于鸡蛋碰石头。所以我们看到李世石的第一盘棋中,在好几个关键地方他都选择简明定形,而不是像他过去擅长的那样专挑复杂变化硬来,也是一种畏惧。但与其说这种畏惧是对机器的,不如说,是对围棋本身蕴藏的无限可能性的畏惧。
我看Alphago下棋,会有一种感动,因为想起久被冷落的日本棋手。曾经的日本围棋之所以名局佳话不断,和棋局时间长有直接关系,一盘棋少则二日,多则可以绵延数月,棋手可以从容地穷尽各种可能性 (是不是很像Alphago所做的事),同时,各种无理棋也就基本丧失了生存可能,因为只要有足够时间计算,无理棋一定会吃亏。如此,棋手比拼的就不是对方的失误,而首先是自己每一步着法的最优化,棋手是在和围棋这门技艺相搏 (Alphago的自我对弈其实也可以作如是观),而不是和对面的那个具体争胜负者。此外,对棋型美感的认识,也正来自于在此种技艺中浸淫日久的一种感官进化,绝非什么“无用之用”的视觉效果。如我们在川端康成的 《名人》 中所见,棋手的尊严首先不是来自胜负,而是来自他从围棋这门技艺中所获得的人格滋养,以及他在一方棋盘上所奋力捕捉到的,有关美和时间的真谛。藤泽秀行当年说他对棋道只知百分之六七,放在今天人机大战的背景下,我们就会明白那不是谦辞,而秀行先生年轻时通过读中国古诗来长棋力的体会,大概也是如今柯洁之辈所无法想象的事。
某种程度上,Alphago可以看作朴实无华的李昌镐和全局感一流的道策的合体,且拥有足够的人类时间,与其说它象征着非人的力量,不如说,它意味着向着围棋中深藏的超越一两代人的人类价值观无限靠近。在中韩年轻棋手纷纷化身成一台台高能高耗的现代作战机器的时候,Alphago却更像是一位江户时代的名棋手,它穿越时空来到我们中间,它带来的胜利是属人的、古典的胜利。
进化与退化
人机围棋大战第二盘结束之后,焦点不再是人工智能的水平或李世石的发挥,而是“劫”。
几乎所有的围棋观众都发现,在李世石和Alphago的两盘棋中,都没有出现严格的劫争,即便在逆境中李九段也没有用劫争来求变。因为在围棋上的劫争会导致机器人的计算量呈指数级增长,所以虽然之前和樊麾的比赛中Alphago已经运用过打劫技术,职业棋手仍旧纷纷猜测Alphago可能不擅长打劫,尤其在复杂局面下的劫争,赛后在各种论坛和自媒体平台更是有所谓秘密协定禁止打劫的阴谋论流传。当然随后Alphago的开发者之一,也是现场执棋的黄士杰已经出来辟谣,说不存在所谓不能打劫的保密协议。也有职业棋手出来撰文说明第二盘棋局劫争在棋理上的不可行性。
且不论最终事实真相如何,我觉得特别有意思的是,那些鼓吹阴谋论的国人,竟然都是以一种正义化身和公平使者的面目出现的。
为了简化讨论,我们假定罗尔斯的理论是可以接受的,即正义的理论就是公平的理论,“正义即公平的相对稳定性”,下面是他著名的两个原则:
1.每个人都应有平等的权利去享有与人人享有的类似的自由权体系相一致的最广泛的、平等的基本自由权总体系。
2.社会和经济不平等的安排应能使它们(1) 符合地位最不利的人的最大利益,符合正义的储蓄原则,以及 (2) 在公平的机会均等的条件下与向所有人开放的官职和职务联系起来。
简单来讲,就是每个人的天赋可以是一种自由状况的不平等,但一个公平和正义的社会有责任引导这种不平等走向某种相对的均衡。在Alphago和李世石比赛的这个具体例子中,如果我们假定Alphago目前的能力还无法胜任非常复杂局面下的打劫 (第四盘似乎验证了这个猜测),即便如此,那么,仅就公平原则而言,为了“符合地位最不利的人的最大利益”,我们应该认为不允许李世石打劫才是最公平的。如果这还有点难于理解,我们可以把Alphago换成一个低段位棋手,那么仅仅从公平的角度来看,比赛规则当然是下让子棋而非分先棋。我们再看一些武林故事,顶尖高手面对挑战者,最公平的办法都是在可接受范围之内由对方来挑选规则。再说远一点,春秋宋襄公待对方渡河成阵之后再战,其实也是一种对正义与公平的自我要求。
退一万步说,即便存在什么不能打劫的秘密协定,我也倾向于认为,那是李九段出于自尊和对公平的直觉而做出的君子协定,因为毕竟,这仅仅是一场电脑对于人类智慧的挑战,而不是一场恶棍之间的权斗,那么,回应挑战的方式,就首先应该是一种有人类尊严的方式。
当然,一个被黑猫白猫论洗礼过数十年的民族,要理解这一点是有些困难的。我们正身处某种不择手段只求结果的劫中,这没有问题,但却因此径直把拒绝打劫视作欺骗与阴谋,从每一件事情上迅速只看到阴暗一面,以正义的名义侮辱正义女神,这对于Alphago的进化都毫无影响,影响的只会是我们自身,令我们不断向着丛林退化。