本页面已浏览101次

设立DeepMind是为了解决什么是“智力”,然后以此解决其他问题。

CEO哈撒比斯(Demis Hassabis)本人也是一个国际象棋好手。他从小开始学编程,16岁开始为Bullfrog工作,开发了Theme Park游戏。

2014年初,DeepMind被Google收购,一年后AlphaGo击败了当时的欧洲围棋冠军樊麾(职业2段)。这也是机器第一次击败职业围棋选手。

然后,AlphaGo挑战了韩国棋手李世石,最终以4-1取胜。第二局AlphaGo下出的37手被一致认为“颠覆了人类百年的认知”。

Game 2, Move 37

哈撒比斯谈到,他曾和Aja Huang聊过,AlphaGo终有一日要挑战职业9段棋手。Huang认为他疯了。哈撒比斯认为这正是最顶尖研究的魅力所在:如果你明确知道某项研究会将你带向何处,那么这项研究也就不成为研究了。

值得注意的是,AlphaGo在“学习”时,有着很多人类业余选手的对局作为参考。下一代作品将是AlphaGo Zero,它不再拥有AlphaGo的出发基础,没有任何人类对局作为出发点。这也成功了。于是,下一步就是AlphaZero——从0开始学习的、针对所有双人对弈的、完全信息游戏!

哈撒比斯认为,游戏对人类的实际生活也是有帮助的:帮助你学会在压力下做决定。但不同的是,生活中的那些“重要时刻”只会出现一次,而游戏提供了一个安全的场所来对人进行训练。

他继而谈到,AlphaZero在训练人类(下棋)时,可能没有什么用,因为机器算得比你快、比你多,还永远不会犯错。但是,AlphaZero确实走出了一些自然就具有战略性的下法。这些下法可以在我们比赛时采纳。接下来的任务是现实机器到底是如何思考、如何评价的。这对人类将非常有用。

哈撒比斯的终极目标是通用AI,对抽象知识的领悟。

Previous Post Next Post