摘要:2024年6月,笔者到访之江实验室并与国家最高科技奖获得者、中国科学院院士李德仁进行互动交流。在对谈中,李院士不经意地问:“你们油气行业的科研工作是假设驱动还是数据驱动?”笔者略加思索后回答:“油气行业,尤其是上游的勘探开发研究,目前还是以假设驱动为主,也就是
2024年6月,笔者到访之江实验室并与国家最高科技奖获得者、中国科学院院士李德仁进行互动交流。在对谈中,李院士不经意地问:“你们油气行业的科研工作是假设驱动还是数据驱动?”笔者略加思索后回答:“油气行业,尤其是上游的勘探开发研究,目前还是以假设驱动为主,也就是先构建一个地质模型,再以此为指导开展迭代研究。”李院士颔首认同。半年多来,笔者一直在深入思考李院士提出的上述问题,并进一步结合近年来汹涌澎湃人工智能发展浪潮,探寻现代信息科技尤其是人工智能给油气资源开发领域带来哪些变革。
一些学者认为,人工智能(AI)是第四次工业革命的标志和引擎,但回顾工业革命演变史,笔者认为人工智能也许是新时代的“人类进步加速器”,将成为促进人类发展新的革命性力量,深刻地改变人类生产生活方式且成为新的时代标志,并引领人类从工业革命时代逐步进入人工智能时代。油气行业发展必须与人工智能时代相适应,尽快从假设驱动为主迈向数据驱动为主。
各有千秋 相辅相成
传统认识中,假设驱动(Hypothesis-Driven)和数据驱动(Data-Driven)作为两种不同的方法论,适用于不同的情境且各有优缺点。
假设驱动是基于现有知识,依赖理论、经验甚至直觉提出事物如何运作的假设,再通过观察、实验、调查或其他形式的数据来验证这些初始假设,比如通过露头观察、薄片扫描、岩心分析、地球物理探测等直接获取的地质信息来验证预先构建的地质模型,本质上是一种以“试错法”不断校正逼近真相的过程。其优点在于有明确的方向和目标,可以快速聚焦于特定的问题或解决方案;缺点是最初的主观性假设可能不准确,导致后续验证工作出现主观设计上的偏差。“油气在地质学家的脑海里”,即是油气行业假设驱动的典型理念。
数据驱动强调用数据说话、让数据作主,通过尽可能多收集相关数据,使用统计分析、概率计算等数据分析方法来挖掘数据中的模式、趋势和关联,本质上是一种基于数据的“设计法”寻求最优解的过程。其优点在于可以更加客观地揭示之前未被注意到的洞见;缺点是数据代表性与质量问题、过度拟合以及对大量数据处理能力的需求。但随着人工智能时代的到来,机器学习、数字孪生、量子计算等技术组合应用给数据驱动方法论带来了强大的内核升级,必将打破拥有海量数据的油气行业固有发展路径和逻辑。
假设驱动与数据驱动从来不是非此即彼的对立选择,而是相辅相成、不可割裂的两种思维方式。就像人类和AI的关系,远非简单的取代与被取代所能概括,实际上是一个相互学习、共同提升的过程。在假设驱动的创造性思维方面,AI目前还难以与人类相提并论,它对特定问题的优化与求解,还不是真正意义上的理解与创造。相比之下,数据驱动的AI因其强大分析能力不断地拓宽人类的认知边界,但人类的泛化能力和创新思维仍然尤为宝贵。
石油勘探开发是典型的综合性应用学科,成功找到油气并商业开发是一项复杂的探索发现过程,需要地质勘查、地球物理探测、钻井、储层改造、油气开采等多种技术手段、大量数据积累以及不断优化的预测模型支撑。
假设驱动 认知先行
早期油气发现主要依赖直觉和经验驱动,出露地表形成的油气苗是寻找地下油气的主要依据。
美国宾夕法尼亚州泰特斯维尔城附近的一条小河因常常漂着原油,被当地居民称为“石油溪”。1859年,埃德温·德雷克在石油溪旁钻成了世界第一口商业性油井——德雷克井,成为现代石油工业发源地。
中国早期油气勘探开发活动也多围绕油气苗展开,如新疆“黑油山”附近发现克拉玛依油田,甘肃“石油沟”旁边发现玉门油田,青海“油砂山”附近发现油砂山油田。
地质理论假设驱动大油气田发现。19世纪中叶,地质学家们发现美国宾夕法尼亚地区油气均位于砂岩层的最高部位,推动背斜找油等相关理论形成,为后续全球大规模油气发现奠定基础。之后,加拿大石油地质学家T.S.亨特、苏联地球化学家B.A.别纳科依、美国地质学家W.E.普赖特等基于数据分析和油气勘探开发实践,发展了海相生油理论,引领中东等地海相油气大发现。
中国地质学家谢家荣、李四光等人基于对中国地质特征的认知和推断,提出了陆相生油理论,打破了国外传统观念束缚,推动大庆、胜利油田发现,成为假设驱动寻找油气资源的典型范式。
最近,我国石油科技工作者提出的煤岩气地质理论已得到成功的实践验证,亦是假设驱动寻找新类型油气资源的例证。
数据驱动 快速迭代
当前油气发现仍主要依赖于人脑智慧和实验验证,通过假设驱动提出科学问题,利用数据驱动进行辅助验证。但随着油气赋存方式的复杂化,传统经验已经难以支撑油气发现,特别是非常规油气逐渐成为勘探开发主体的当下。尽管人工智能技术还存在一定的局限性,还不能完全解释数据背后的地质规律和渗流机理,很难对复杂地质条件做出客观准确的判断,但科学家们已意识到数据资产的重要性和数据技术的变革性。
2024年6月,之江实验室开发的GeoGPT地学大语言模型通过备案,已实现文献阅读、信息提取、地质图解译与生成、知识图谱构建等功能,成为人工智能助推地球科学研究模式变革的标志性事件,它的强大功能使我们对智慧油气藏的遐想成为可能。2024年11月,中国石油发布了700亿参数昆仑大模型,还带来了43个石油行业的专业应用和通用应用创新场景。油气勘探领域,国内首次构建了涵盖地震处理、地震解释、测井处理解释3个专业模型,相比传统方法,在泛化性、精度等方面都有了大幅提升。
人的寿命和知识掌握能力是有限的,相比之下,人工智能在记忆能力、高维复杂、推理深度等方面具有强大而独特的优势,可以快速修正并迭代完善假设驱动形成的经验模型,极大地提升人类科学发现效率。
不久的将来,如果人工智能油气大模型能够拥有全球油气勘探开发的历史和实时数据,并实现从推断(inference)到推理(reasoning)的跃升,就具备了科学假想的潜力,从而突破科学家的认知边界,实现真正的行业颠覆。
对于需要和“历史亿万年、地下上万米”打交道的油气行业来说,全生命周期将是涉及海量流程节点的复杂系统工程,以人工智能为技术手段的数据驱动方法将在各个环节中扮演越来越重要的角色,引发的数智化变革将深刻改变油气行业的产业运营模式、科研攻关方式、生产管理范式、勘探开发效率等方方面面。
行业重塑 拥抱未来
笔者在油气行业已工作30余年,见证了该行业的荣光,也一直在思考和探索数据驱动是否将成为石油行业发展的核心驱动力。
近年来,基于系统科学思想与方法,提出的非常规油气规模效益开发“一全六化”工程方法论,其中最为关键的一环就是以数据驱动为引领的数智化管理,主要以大数据系统、数字化管控、智能化决策为基础,打造全面感知、自动生产、实时优化、预测预警、协同研究、一体运行的生产运营新模式,将成倍甚至成数量级地提高油气田生产作业效率。除此之外,奉行数据驱动理念,组织科研力量尝试探索新的资源类型、破解新的技术瓶颈,例如,用“AI+生物学”发明一种终极采油法,实现极限提高油气采收率;用“AI+化学反应动力学”探索氢气、氦气、二氧化碳与岩石矿物间原位物理化学过程,打造地下能源存储及反应工厂。
“未来像盛夏的大雨,在我们还来不及撑开伞时便扑面而来”。2022年底,ChatGPT就像是一场突如其来的盛夏大雨,以前所未有的速度席卷全球,开启了人工智能的新纪元。2024年,诺贝尔物理学奖和化学奖都颁给了从事人工智能的研究学者。近期,DeepSeek在全球掀起的热议浪潮,再次刷新人类对人工智能的认知,更预示着一场前所未有的人工智能科技革命甚至是时代变革的加速演进。
一言以蔽之,AI赋能科学探索的新范式已彰显出巨大的优势,也必将在油气新资源发现、采收率极限提高以及与新能源融合发展等方面展现出前所未见的潜力。
2024年,中国石油已将“数智石油”列为第五大战略举措。毫无疑问,AI将重塑油气行业,以数据驱动为主、假设驱动为辅的新模式将会推动油气行业朝着更加高效、更为智能、更可持续的方向快速前进。作为石油科技工作者,我们要以更加积极的姿态不断识变、应变、求变,主动拥抱“AI+油气”时代的到来。
(作者李国欣为中国石油天然气股份有限公司副总地质师兼中国石油勘探开发研究院党委书记,获得国家科技进步奖一等奖、“孙越崎能源大奖”等奖项)
中国科协科学技术传播中心、陈嘉庚科学奖基金会与本报合作推出
来源:人民网科普