在十年前,围棋界的震动犹在耳边,AlphaGo的精妙走法令李世石等棋手哑口无言。如今,DeepMind的创始人Demis Hassabis回忆起这一历史时刻时,满怀感慨:“那一刻,我们知道人工智能已准备好攻克更为重大和复杂的科学挑战。”这项由AlphaGo启发的技术进步,正在改变整个科学研究的格局。

诺奖得主Hassabis提醒:AlphaGo崛起,人工智能正在统治科学研究

时间定格于2016年3月的首尔,围棋世界冠军李世石对阵一台计算机程序。在第二局的第37手,AlphaGo下出了一个出乎所有人意料的棋招,连解说员都认为那是一次意外失误。可在经过一百多手的交锋后,AlphaGo以胜利告终,现场观众对于这场对弈的沉默延续了近一分钟。十年后,Hassabis再次提及这场比赛时,感慨万千,称那一走是技术的转折点。

围棋棋盘上有着10的170次方种局面,这个数字远超过宇宙中所有原子的总和。面对如此复杂的局面,传统的穷举和剪枝方法根本无法胜任。而AlphaGo的成功在于其创新性地结合了深度神经网络、强化学习和蒙特卡洛树搜索等先进技术。首先,它从人类棋谱中学习合理的落子,然后通过自我对弈不断优化策略,最终在实战中高效搜索最有价值的分支。

而AlphaGo的成就并未止步于此,DeepMind进一步推进了这一理念。AlphaGo Zero以完全自学的方式脱离了人类棋谱,通过随机落子开始学习,最终成为有史以来最强的围棋选手。紧接着,AlphaZero在短短数小时内学会国际象棋并战胜了当时最强的专用引擎,这种能力超越了人类的想象。

Hassabis总结道:“这证明了我们的方法是正确的,时机已成熟,可以为现实世界所用。”AlphaGo所展现的学习与搜索的能力,正在为自然科学的研究带来新的思路。

蛋白质折叠这一人类攻克了近半个世纪的难题,如今在2020年通过AlphaFold 2得以解决。其核心在于氨基酸序列的折叠形式直接关系到其功能,理解蛋白质的结构对于研发新药至关重要。DeepMind在短时间内预测出超过2亿种蛋白质的结构,并将其放入开源数据库,惠及全球科研人员。

在数学推理领域,AlphaProof的诞生标志着AlphaGo思路的延续,借助语言模型和强化学习技术,AlphaProof能够自动学习和证明数学命题。2025年,AlphaProof在国际数学奥林匹克中首次取得银牌,而后Gemini Deep Think更进一步,获得金牌的殊荣。

此外,AlphaEvolve在算法发现上开辟了新天地,它通过模仿AlphaGo寻找最佳落子,实际是在搜索更高效的新算法,成功发现人类未曾想到的新的矩阵乘法方法,为现代神经网络的构建提供了基础。

科学的未来,需要人类与机器的合作。AI协作科学家系统(AI co-scientist)通过一种“辩论式”搜索把AI智能体的优势融入科研流程,实现了科学假设的有效筛选与验证,这一理念已经在帝国理工学院的相关研究中得到了实践。

展望未来,Hassabis提到,像Gemini这样的多模态系统,结合了AlphaGo式的高级搜索、强大的世界模型和专用工具的协作,目标是实现真正的通用人工智能(AGI)。他认为AGI不仅要在棋类游戏中胜出,更要能够创造出像围棋一样深邃且值得长久研究的新游戏。

诺奖得主Hassabis提醒:AlphaGo崛起,人工智能正在统治科学研究

在过去的十年里,从蛋白质折叠到数学金牌,从算法优化到AI协作科研,AlphaGo的技术遗产已经不仅限于棋盘,而是渗透进科学研究的核心。未来的“第37手”会在哪个领域产生?尽管Hassabis没有给出具体答案,但他指出,目标的光芒已然显现于地平线之上。