AI进化至极致，做研究会比科学家更聪明？-车市号

AI进化至极致，做研究会比科学家更聪明？

中国战略新兴产业

32771 2024-11-20

中国战略新兴产业融媒体记者艾丽格玛

人工智能的终极目标是增强人类智能，而非取代人类。人工智能系统将作为研究者的助手，提供数据分析、模式识别和决策支持，而人类研究者则可以专注于提出新的假设和理论，进行创新性思考。这种协同工作模式将最大化地发挥AI的计算能力和人类的创造性思维。

人工智能在科学研究领域应用的步伐，似乎加速了。

10月，诺贝尔物理学奖和化学奖都颁发给了与AI相关的研究成果——一个是利用人工神经网络实现机器学习的基础性发现和发明，一个是用AI作出蛋白质结构预测方面的成就。10月31日，Cell杂志发布的一篇文章深入探讨了AI代理（AI agents）如何加速生物医学研究的突破，及其在与研究人员协同合作中发挥的关键作用。11月4日，“2024科学智能峰会”在北京召开，峰会上，专家们探讨了AI技术在量子计算、生命科学、材料研究、高性能计算等多个领域的应用。

AI for Science（简称“AI4S”）似乎逐渐成为常态，不少人认为，人类站到了科研范式的转折点上。那么，AI到底如何帮助科学家作出研究？它带给科学界的变革可以到达多深的层次？AI会有完全替代科学家的那一天吗？

AI怎样让科研范式产生变革？

想了解人工智能到底怎样帮人们做科研，首先需要看科学研究的基本原则。

回顾过去，科学探索的历史是一部人类对自然界不断追问和解答的历史。从古代哲学家对自然现象的好奇，到中世纪炼金术士对物质转化的探索，科学探索的脚步从未停歇。1000年前，沈括在《梦溪笔谈》便对“琴弦共振”现象、磁针不完全指南（即磁偏角）现象的发现、描述与研究写下记录与研究；到17世纪，伽利略把数学与实验密切地结合起来，把各个物理量之间的关系用数学表达式表示出来，揭示了各个物理量之间的内在的联系，把实验结果上升到普遍的理论高度，并有意识地在实验中丢开一些次要因素，造成理想化的物理条件，抓住问题的根本，开辟了科学实验的道路。

19世纪，工业革命不仅改变了生产方式，也推动了化学、物理学和生物学等领域的飞速发展。科学开始变得更加系统化和专业化，研究者们开始使用定量方法来探索自然界的规律。在20世纪，人类迎来了科学革命的新高潮。量子力学和相对论的提出彻底改变了我们对宇宙的理解。同时，计算机科学和信息技术的兴起为科学研究提供了新的工具，使得科学家能够处理前所未有的大数据集，进行复杂的模拟和分析。

所谓的科研范式，指的就是科学共同体普遍接受并用以指导研究的理论框架、方法论和行为规范的集合。“范式”是托马斯·库恩在著名科学史、科学哲学著作《科学革命的结构》中提出的核心概念，这本书的诞生标志着一场认识论的变革，其影响力超出一般的自然科学领域，延伸至社会科学乃至文学、艺术等。它能确定哪些问题是重要的，解决重要问题的有效方法是什么，以及用什么标准来判断一个问题的解决方案是合理的。因此，范式就是在某个学科内从事科学研究的一套基本完善的规则和行为标准。

人类科研范式的演进呈现出螺旋式上升的轨迹——起初，是基于观测数据的归纳经验范式，以开普勒为典型代表，他通过细致的观察和基础的数学运算，揭示了行星运动的定律；随后，是第一性原理的理论范式，牛顿是这一范式的杰出代表，他从物质的本质出发，探索并发现了普遍的自然规律，并以方程的形式加以表述。

不过，数据驱动的方法尽管可以有效地通过数据发现事实，但是不能很好地帮助人们找到事实背后的原因。而基于第一性原理列出的数学方程，则往往很难求解。

以量子力学为例，英国物理学家狄拉克就曾预言，寻求基本原理的任务已大体完成，但因为其数学问题太复杂，变量函数太多，当变量个数增加时，计算量呈指数级增加，故而用基本原理来解决实际问题会非常困难。如果用传统物理计算的方式来算分子模拟，会面临“维度灾难”，即随着变量的增加，问题的复杂度会呈指数级增长。特别是面对大系统和长时间尺度的模拟，不仅耗时高、模拟成本高，也很难算准。

而AI技术的应用，使得科学研究可以更深层次地利用大数据和机器学习算法，从海量数据中发掘科学规律和新知识，这是与传统假设驱动科研方式的根本区别。而且，AI可以自动进行数据分析、模式识别和预测。

人工智能技术历经20世纪80年代的繁荣和90年代初的寒冬，终于在今天，靠着更强大的计算机和大数据集的出现，实现了复杂人工智能模型的开发和训练。特别是在机器学习和深度学习方面的突破，使得人工智能有能力从海量的数据中不断学习，并随时间得到改进。

上海交通大学人工智能研究院常务副院长杨小康就提出，“人工智能技术更好助力科研，离不开算力支撑，需要构建高效稳定的人工智能异构算力底座。”

DeepMind公司的蛋白质结构预测算法AlphaFold2，也就是获得今年诺贝尔化学奖的算法，就完全是数据驱动的，没有用到任何物理模型，输入序列（更准确地说是Multiple Sequence Alignment，多序列比对），就能得到蛋白质的结构。换句话来说，通过AI，我们可以完全基于数字计算和模拟的结果，来推测现实世界中的蛋白质三维结构，并且推测结果相当准确。

深刻影响科研全流程

微软亚洲研究院资深首席研究员谢幸认为，人工智能不仅是一项技术奇迹，也是助力人类改变世界的催化剂。从教育、医疗到娱乐，人工智能与不同领域的融合都给人类社会带来了巨大的变革，带来了前所未有的机遇和挑战。

《2024年人工智能指数报告》显示，AI技术能够帮助工人更快地完成任务并提升工作成果的质量。

在科学研究的几乎所有流程中，人工智能都可以扮演重要的角色。

例如，AI技术在处理和分析大量科研数据方面展现出了巨大的潜力。利用AI，科学家们能够高效地处理和分析天文观测数据。AI算法不仅能够自动识别和分类天体，还能发现新的天体现象，并且在天体图像中识别和分析特征与模式。这些技术的应用可以极大地促进科学家对宇宙演化和结构的理解，进而推动天体物理学研究的快速发展。

在信息处理方面，AI可以快速扫描大量文献，提取关键信息，帮助研究人员更快地获取相关的研究进展和参考资料。有时候，科学文献本身就存在着潜在的隐含知识和关联，这些知识和关联可以通过分析和挖掘文献来揭示。随着科学文献的数量呈指数增长，AI在文献检索、文本挖掘和信息提取方面的应用变得越来越重要。基于自然语言处理（NLP）技术的AI工具可以自动总结科学文章，生成研究的综述报告，甚至预测未来的研究趋势。

AI技术在模拟复杂系统方面表现同样出色。例如，在气候模型中，AI可以帮助科学家更准确地预测气候变化趋势，评估不同政策对环境的影响。又如，在药物研发过程中，AI可以通过模拟药物与靶点的相互作用，缩短新药的研发周期。

AI还可以辅助科学家设计实验，通过算法优化实验参数，提高实验的成功率和效率。并且，可以协助进行实验测试的两个关键步骤：规划和引导，为设计实验、优化效率以及探索未知领域提供系统性的方法。2023年，Nature杂志发表了加州大学伯克利分校的一项研究，他们开发的A-Lab能够自行设计出合成产物所需的配方，自己做实验，分析、解释实验数据，并自行决定如何改进后续实验。在17天的连续实验中，A-Lab开展了355次实验，合成了58种目标化合物中的41种，其中9种是在主动学习改进了合成过程后得以实现的。A-Lab的合成成功率达到71%，相当于每天成功合成超过两种材料。

AI的引入使得科学研究的速度大幅提升，研究人员可以将更多时间投入到创新和探索中，而不是重复性的手动数据处理。而且，AI能够快速生成研究假设并设计实验方案，帮助研究人员更快地推进科学研究进程。

连接跨领域学科的“巴别塔”

图灵奖得主、中国科学院院士姚期智认为，人工智能科学未来发展将呈现两大趋势，一是从弱智能走向通用智能，二是为学科间的交叉赋能，如具身智能、AI仿生、AI+量子等新技术、新应用将大量涌现。北京科学智能研究院副院长、深势科技创始人兼首席科学家张林峰也认为，AI for Science最大的特点是，它以一种前所未有的方式，将不同学科、不同背景的人们连接在一起。

在生物学领域，AI技术的应用正在改变研究的面貌。例如，SATURN结合蛋白质序列和基因表达信息来获得单个细胞的通用表示。AI技术在基因组学中的应用，如将序列映射到表型，揭示不同遗传和环境因素影响下各种分子层面相互作用和调控的机制。AI在蛋白领域的应用是另一个经典例子。前述的预测生物分子相互作用的方法，如AlphaFold和RoseTTAFold-AllAtom，已经取得了巨大的进步。这些工具能够模拟来自冷冻电子扫描显微镜数据集的连续构象和组成异质性，为蛋白质工程和结构预测提供了强大的支持。又如，人工智能辅助酶工程可以进行酶功能预测和酶分子改造。目前，基于机器学习并采用公开数据集，已成功解决蛋白质的溶解度预测、功能预测、稳定性预测和结构预测等预测类问题。

在材料科学领域，AI技术的应用显著提速了数据驱动的材料学研究。例如，电子科技大学团队开发了高比能锂金属电池状态估计与寿命预测的机器学习方法，指导设计了延长电池使用寿命的方法。又如，中国科学院物理研究所团队与张强/陈翔团队合作，结合机器学习模型与高通量筛选，开发了宽温域电解液新分子。

AI技术也在农业科技领域发挥着重要作用。中国农业科学院加速推进农业科技与人工智能技术融合创新，在生物育种、智能农机装备等领域组建交叉学科团队。中国农业科学院作物科学研究所研究员、国家南繁研究院副院长李慧慧指出，“常规育种方法依赖经验，耗时长，且对表现型容易受环境影响性状的改良效率较低。通过人工智能算法，科研人员能够在育种家进行田间试验前，快速预测作物田间表现，大大缩短育种周期。”李慧慧带领团队致力于开发基于深度学习算法的基因组选择模型、全流程智慧育种平台等算法工具，提升水稻、玉米、小麦等主粮作物的育种效率。

在医学领域，AI正在药物研发、疾病筛查、生物学机制研究等方面发挥着越来越重要的作用。AI的应用使得很多疾病的通路和影响因素将不再神秘，最终有望介导人类健康乃至整个生命科学领域的系统进步和重大突破。AI用于靶点选择、虚拟筛选产生先导化合物、优化过程中针对药物性能预测，包括活性、选择性、药代及毒性等，还可以加快临床化合物的获得。同时，AI也可应用于临床实验的设计、病人的选择、药物联用的推荐以及老药新用的方向等。

东京大学神经智能国际研究机构特聘教授长井志江提出，我们需要探索人工智能的新应用，改变神经科学研究的方式。“例如，我们与发展心理学家合作，利用人工智能技术分析儿童的行为以及他们与周围人的互动，借助人工智能技术模拟和预测人类的发展。人类在婴幼儿时期的个体差异要小于成年以后，我们希望可以模拟人类的智能和智能的发展，以便更好地预测未来。我们还与研究自闭症谱系障碍的研究员合作，他们希望了解哪些神经机制的差异影响了自闭症儿童长大后的社会行为，以及他们可能遇到的困难和解决办法。在这方面，人工智能具有很强的分析预测能力，不仅可以分析大量数据，还可能预测人类的智力，从而促进和改变其他研究领域。”

当然，必须关注的是，AI系统在处理海量个人数据时，如何防止数据泄露和滥用。为此，应明确不同企业的角色定位，确认责任边界，在责任主体方面，需根据特定的业务场景、技术逻辑和法律规范明确其属于数据控制者、数据处理者抑或是其他主体角色。研究人员和实践者需要寻找更好的方法来提高机器学习模型的透明度和可解释性，同时解决解释性质性问题，例如如何避免过度解释和欺骗性解释。AI技术的发展同样面临伦理道德与法律监管的挑战。同济大学人文学院特聘教授杜严勇指出，“无论人工智能大模型的伦理再强大，毕竟还是拥有工具属性。因此，我们一定要保证，在重大决策方面，‘人类’必须在决策环中。人工智能大模型必须处于人类监督和控制之下。”

可以预计，AI技术的进步必将极大地推动科学研究的发展。中国科学院院士、清华大学人工智能研究院院长张钹教授指出：“人工智能的发展方向是人机协同、混合增强智能系统，即利用机器的特长来弥补人类的短板，同时利用人的认知能力来弥补机器的不足。” 这意味着，AI技术将与人类专家紧密合作，共同解决复杂的科学问题。