Demis Hassabis、深思（DeepMind）以及AI

14th May 2023

本页面已浏览101次

设立DeepMind是为了解决什么是“智力”，然后以此解决其他问题。

CEO哈撒比斯（Demis Hassabis）本人也是一个国际象棋好手。他从小开始学编程，16岁开始为Bullfrog工作，开发了Theme Park游戏。

2014年初，DeepMind被Google收购，一年后AlphaGo击败了当时的欧洲围棋冠军樊麾（职业2段）。这也是机器第一次击败职业围棋选手。

然后，AlphaGo挑战了韩国棋手李世石，最终以4-1取胜。第二局AlphaGo下出的37手被一致认为“颠覆了人类百年的认知”。

Game 2, Move 37

哈撒比斯谈到，他曾和Aja Huang聊过，AlphaGo终有一日要挑战职业9段棋手。Huang认为他疯了。哈撒比斯认为这正是最顶尖研究的魅力所在：如果你明确知道某项研究会将你带向何处，那么这项研究也就不成为研究了。

值得注意的是，AlphaGo在“学习”时，有着很多人类业余选手的对局作为参考。下一代作品将是AlphaGo Zero，它不再拥有AlphaGo的出发基础，没有任何人类对局作为出发点。这也成功了。于是，下一步就是AlphaZero——从0开始学习的、针对所有双人对弈的、完全信息游戏！

哈撒比斯认为，游戏对人类的实际生活也是有帮助的：帮助你学会在压力下做决定。但不同的是，生活中的那些“重要时刻”只会出现一次，而游戏提供了一个安全的场所来对人进行训练。

他继而谈到，AlphaZero在训练人类（下棋）时，可能没有什么用，因为机器算得比你快、比你多，还永远不会犯错。但是，AlphaZero确实走出了一些自然就具有战略性的下法。这些下法可以在我们比赛时采纳。接下来的任务是现实机器到底是如何思考、如何评价的。这对人类将非常有用。

哈撒比斯的终极目标是通用AI，对抽象知识的领悟。