摘要:从历史视角来看,站在当前历史的时间节点,AI技术或将导致整个生物医药行业的范式可能会有所革新,会由传统的经验驱动向数据驱动进行革新。影响领域包括靶点发现、药物设计,以及研发全流程的智能化,还有个性化的精准医疗。
势不可挡
本文为微解药举办的医药机构人工智能应用主题专家论坛直播观点整理。专家来自金赛药业、信达生物、丹纳赫贝曼库尔特、全球生物医药公司和CRO机构。
一、核心观点:
1、DeepSeek对医药行业的影响
1)历史视角:AI技术或将革新生物医药行业的范式,由经验驱动转向数据驱动,涉及靶点发现、药物设计、研发全流程智能化及个性化精准医疗。
2)经济视角:随着AI快速发展和数据处理能力跃迁,医学影像、体外诊断、设备与服务、药物研发、基因测序分析等领域预计每年带来近400亿美金的直接增量。
3)产业视角:AI技术加速行业重构,可能形成新的竞争格局,但头部集中趋势或不受影响。中小竞争者和头部机构在技术层面实现重构。
2、DeepSeek在药企的落地实践
1)应用场景:文献标签化、报告生成等辅助工具;销售培训;不良反应事件识别(AEPC)会议纪要撰写;科研文献检索和汇总。
2)最受欢迎场景:会议纪要和科研文献检索汇总,显著提高效率。
3、药企与IVD企业运用DeepSeek的异同
1)药企:针对特定疾病和场景使用药物。
2)IVD企业:涉及生化免疫项目,综合判断疾病,报告解读风险大,需专业医生审核。
3)IVD企业应用:多用于报告解读支持,但头部企业谨慎考虑风险,尚未官宣结合。
4、大模型公司与药企合作中的挑战
1)企业内部缺乏可信数据,限制大模型发挥更大作用。
2)人工审核必不可少。基于输入、预料和幻觉问题,输出内容最终需要专业人工审核。目前只能给专家做内部参考。
3)内部模型功能受限:企业内部工具需比外部工具更好用,否则难以管控员工使用。
4)挑战:数据安全和防止泄露;合规和严肃科学领域的风险管控。
5、人工智能时代投资倾向
AI助力生物制药领域创新,中国生物科技制药有望成为全球创新力量。
选择特定技术领域进行持续投资,可能颠覆现有认知,聚焦创新。
未来小而精的团队和敏捷型组织将有更大发展。
二、深度问答
Q:DeepSeek对医药行业的影响?
药企运营专家:从DeepSeek来讲,对医药行业的重大影响可从三个维度-历史视角,经济视角,还有产业视角去看。
从历史视角来看,站在当前历史的时间节点,AI技术或将导致整个生物医药行业的范式可能会有所革新,会由传统的经验驱动向数据驱动进行革新。影响领域包括靶点发现、药物设计,以及研发全流程的智能化,还有个性化的精准医疗。
从经济视角方面来看,随着人工智能的快速发展,包括渗透的大背景下,整体数据处理能力的跃迁,全球生物的增量空间会急剧放大。大概预测,医学影像,包括体外诊断、设备跟服务以及药物研发,还有基因测序分析方面,会带来每年接近400亿美金的直接增量。
从产业视角来看,随着AI技术加速发展,整个行业的重构,可能会有新的竞争格局变化。虽然AI的普及在某种意义上能够使得中小竞争者,包括头部机构在技术层面实现技术的重构,但是它可能不会影响整个医疗行业的竞争格局向头部集中的趋势。
Q:DeepSeek的出现对医药行业的投资影响?
药企运营专家:AI发展有助于生物制药领域整体创新力的提高。医药行业在全球看来,还有很多技术没有突破,但是它也不会妨碍中国生物的科技制药,能成为全球的一个创新力量。
技术领域投资方面,专注方向是小而美跟专而精。从企业端来讲,也会选择一到两个技术领域进行持续的投资,包括可能会从底层逻辑上颠覆现在的认知,大家会更加聚焦、专注创新,去改变制药世界的格局,让中国的制药企业成为制药行业的DeepSeek。
DeepSeek的团队是比较趋于扁平化的,他们非常愿意去用应届毕业生,包括国内知名高校的毕业生。未来是小而精的团队,包括敏捷型的组织,会在我们这种企业的内部有更大的发展。
Q:DeepSeek在企业当中的应用和挑战?
药企CIO:从泛DeepSeek角度来讲,大模型这件事情最早从ChatGPT-4开始,我们公司就在做一些尝试。
首先我们是接了外部的GPT连接,过去一年多时间里,把它作为一个辅助工具,不管是文献的Labeling(标签化),还是文件生成各种各样的报告。我们不仅服务公司内部,也去服务了很多儿科医院的专家的科研需求。
大模型类似于我们一个本科生,可以帮你做一些初显的文章分类工作,节约了一些人手工去打标签的时间,节约我们整理案头工作的时间。这个点,不管哪个大模型现在都能做得挺好,而且每一代的大模型更新都会让这个变得准确度更好。要人工校验的部分会变得更轻松一点。
第二个部分,就是在销售的培训上。以前很多都是纸、笔、答,现在有了大模型,可以让他蒙眼考、随机考、场景roleplay,已经变成了随处可在。以前是应试教育,只是为了考试而教育,现在是随时要抽查有没有掌握到位,包括新的一些内容怎么快速去覆盖到销售。我们最早是从销售开始,因为他们工作比较紧急。但我们现在基本上所有的培训领域,不管是供应链、研发,只要是要保证这个人时刻掌握某些知识的地方,都是可以去做的。但也是要注意不要把公司内部的资料往公网上传,DeepSeek的思维链确实很有用,但这样子的有用也会影响到我们的严谨性和专业度。之后如果有更好的大模型布好了,我要干的第一件事情,就是把所有的联网大模型全部掐了,已经看到了很高的风险。公司数据不能外传是我非常关心的一件事情。
Big Pharma信息技术专家:我们内部在使用人工智能这方面非常早,三年前我们就引入了当时是GoogleBERT模型去做分类,主要是做的AEPC(不良反应事件的识别)的识别,本身效果是非常好的,一定程度上是比我们内部人工的识别准确率高得多。ChatGPT-3推出来之后,我们也是第一时间拿到了API,进行相关的集成调用和测试。在我们内部,针对AI,尤其是生成式AI这块的落地案例还是非常多的。
DeepSeek对于我们来说可能最大的一个创新点,或者对于我们来说有一个比较大的改变是它可能更偏向于逻辑推理。ChatGPT-3、4,一直到OpenAI o1之前,拿到的这些生成式的大模型,可能都是偏向于文科生。它是基于过往我们给到它的数据进行一个归纳总结出来的推理,它是一个归纳法。
生物医药,尤其是涉及比较复杂的逻辑推理,包括数据问题解答,甚至生物医药的一些研究方面,可能需要的是一个偏理科生的演绎推理。DeepSeek这次推出的R1引爆全网的最大差异点是除了它本身的COT以外,还可以去做比较好的逻辑推理。对于我们来说,这是解决了以前在使用GTP-3和4去做一些复杂问题,多跳逻辑问题解答的时候,它不够智能,或者说浮于表面,仅限于现在获取一些数据。而R1的能力尤其在学术科研方面提供更大的支持,它可以帮助我们自主地去做一些搜索,把相关信息进行整合。
最受欢迎的场景,第一肯定是会议纪要。我们内部有非常多的会议,内部的,外部的,也有英文的,中文的,各种语言的会议,多语言的会议纪要撰写一直是老大难问题,包括我们跟外部老师去召开一些学术会议,会议完之后怎么去沉淀这些相关的知识,老师观念到底是什么样子,怎么去进行一个有效的梳理和整理,之前都没有特别好的解决方案。在生成式人工智能引入之后,大家对于会议纪要这块,满意度是非常高的。
第二是帮助团队进行一些科研文献的检索和汇总。过往学术科研方面,需要人和AI相互配合。引入R1之后,直接联网信息给到它,再给它一点训练和内部的知识和资料,让它帮我们去做更多的学术科研。总体输出的科研报告对于我们医学部来说还是非常满意的,大大节省了他们过往自己进行搜索、阅读、文献整理,再去梳理生成一个报告的过程,效率是大幅提升的。医学部和临床团队非常期待进一步引入人工智能的能力。
挑战这块,就是公司内部的数据安全和防止泄露情况。举个例子,会议纪要这个场景,内部会议的信息输出,我们一定不希望让外部的大语言模型获取到详细的信息,或者是拿过去做训练。如果有一天我们能通过大语言模型的问答获得恒瑞或者金赛等公司的会议纪要的信息,对我们来说是比较恐怖的一件事情。所以我们内部的临床和研发团队,特别审慎和谨慎,会要求加强这方面的数据安全管控,一般也会优先去选择本地化或私有化部署的一些蒸馏模型或者小模型。
还有一个点是非常重要的幻觉这个问题,对我们来说,它有利也有弊。在有利的情况下,我们可以利用它的幻觉,帮助我们去做一些头脑风暴,帮助我们去补盲,发现我们过往惯性思维当中,没有考虑到的一些点,甚至在一些药物研发,或者一些解决方案思路上,能够给到一些亮点和创新性的考量。另外一方面,特别是在医药行业合规和严肃科学领域,一定要加强这方面的患者管控。总体来说,对于AI引入既有忧虑,也是非常兴奋和期待。
Q:DeepSeek在药企和IVD企业运用中会有哪些异同?
国际检测医学顾问:我的角色可能跟前面两位的嘉宾不太一样,前面两位嘉宾是从技术角度,内部角度来讲,而我所在公司的部门是和专家、医生去做沟通。
大语言模型应用的气氛跟之前是不一样的。之前我们跟客户沟通的时候,是我们去跟客户说有这样的工具(大语言模型等APP),可以去做一些应用,提高效率。之前拜访十家医院,那些医院都不知道有这样的东西存在。但过年回来以后,就完全不一样。医生会告诉你,他试过、用过了这样的东西(DeepSeek)。之前的大语言模型可能受限于一些因素,不是每个人都可以使用到,现在的DeepSeek是每个人都可以有机会去做尝试。在这样的尝试背景之下,大家主动去使用这个工具的意愿特别强烈。
前面两位嘉宾分享了在各自公司应用的情况,包括一些提质增效的场景,我分享在客户端的情况。
药企更多的是强调于临床应用场景,使用什么样的治疗(treatment)方式是更合适的,treatment可能会对于一些疾病的某个因素有影响。在IVD,会有一个很大的特点,就是项目相对来说比较固定。我们去体检的话,各个公司的项目是差不多,都是生化免疫项目,在于项目本身的报告解读以及这个项目的一些抗干扰性,包括项目本身的一些特点。这个是要在我们的解读中能体现出来。所以在报告解读需要场景上面,无论在客户端还是在公司,都是有这个需求的。
检测技术跟药物是不一样的,药物治疗是讲有效性的,而检测技术,有两个维度,是刻意度和灵敏度,不可能存在一个技术它的刻意度、灵敏度都是100%。像我们去做体检,如果看到肿瘤指标高了那么一点点,作为体检者肯定是比较慌张的。这个时候,临床上面是结合这个指标跟临床特征去做综合判断,还会给患者一些建议。
现在设备跟技术是非常成熟的,但是这个设备跟技术推到基层医院里,基层医院医生怎么样来解读这个报告,怎么给他的临床一个正确的支持,这是我们现在IVD企业里经常会遇见的场景。
药企可能只是针对一种疾病,某一个场景,让药物来使用。而IVD企业,做生化免疫的项目,对于疾病的综合判断就很大。只跟我解读心肌,或只解读某一个指标,是不太一样的,可能还是希望有更广泛的一个报告解读,但这里会承担一个很大的风险,解读出来的对与不对,谁来负责。目前的模型应用,肯定是没有办法直接去开放给到患者,因为患者是没有办法去判断的。我们即使做了报告解读的东西(应用),也是仅用于或服务于有医学解读背景的人去用。
因为他有一个解读的背景,他可以去判断这些信息是不是真,这也是跟我们后面讲的审核是有关系。从这个角度说,企业是非常主动地拥抱DeepSeek的。在IVD,包括像华大基因、圣湘基因、金域等,他们都提到了跟DeepSeek的应用结合。但是他们更多的是在报告解读上面给到现在医生的支持。特别像华大或者像金域,他们有一些非常冷门的项目,对于医生来说,也不是特别了解,这些项目的结果怎么判读,是需要支持的。但会发现有一个意思的点,就是头部的迈瑞或者外企的四大家-罗氏、雅培、西门子医疗和丹纳赫,这几家都没有官宣跟DeepSeek的结合,可能也会考虑到其中的一个风险存在。现在跟DeepSeek接入,一个是信息外传的问题,另外这个信息造成的责任跟风险到底怎么来承担,可能是有个摸索的过程。但很好的点是现在医院也在主动拥抱DeepSeek的技术,像瑞金医院是病理模型应用;吉大医院也在做本地知识库的部署。所以在这背景之下,随着医院的应用,对于其中的风险跟一些实际的情况,就不会对大模型有个万能的想法,沟通会更顺畅。
像这样一个解读的应用,我们还是非常小心,不是给到患者to C端的一个应用,更多是to B端,给到医院,具有专业知识的人,可以在医生审核之下,作为一个有效的助手,查漏补缺的角色,帮助医生、检验师去做他的知识。
Q:CRO角度看企业应用大模型的挑战?
CRO专家:首先,我们确实也是接入了DeepSeek,而且是满血版。我们角色比较特别,内部已经在一些场景上开始用DeepSeek了,之前一直也是在用大模型,用的一个是我们自己的内容。在一些时候,(DeepSee)也作为知识库,像员工手册、SOP等全部都在这个上面,方便大家能够快速地检索,然后通过问答机器人能够快速地得到相关的答案,这是一个非常快速的成果。
我们现在逐步要开始用它来做自己的内容生成,以后大家看到我们的一些片子,可能就是有AI在里边参与制作。当然像销售培训,销售考核我们今年也开始了。其实我们去年就想做这个事,但因为这个事很耗时间,所以去年一直没有能够做起来。
第二个,我们给到外部(甲方)的这些服务,分几块。一块是营销,因为我们一直在做的是精准营销的部分工作,所以在企业营销这边,我们发现了非常多的场景。
我们从2023年开始应用ChatGPT的模型,到现在我们用DeepSeek,中间会看到一些很有意思的现象。企业营销躲不开客户的问题,和客户打交道过程中,我们也把大模型接进来。
在这个过程中,看到DeepSeek一些额外获益,能够帮助我们在跟客户打交道的时候去解决,尤其是一线的很多同事反馈比较好,当中也还扩展了更多的,包括怎么去选我的客户和我的资源,我的决做和我的内容间的匹配关系。
之前不管是会议纪要,还是内容,是一个相对浅层次的,接下来我们进入到一个深水区。
目前遇到的挑战主要有三个方面:
1.企业内部现在存在一个比较明显的大问题,就是所有企业存在缺数据。DeepSeek一方面带来的是它的推理,很华丽的辞藻,另一方面是它可以蒸馏数据,并且能够让小模型的能力大幅度提升。讲得明确点就是强化学习的路径。强化学习,需要拿到一些对或者错,或者能够对质量评判的数据,但是我们现在在企业内部是缺的,甚至是没有可信的数据。这件事情其实是严重限制了大模型在企业内部发挥更大作用的非常关键的因素。目前强化学习的路径当中,需要的是一个可验证的数据,否则就会需要大量的人工去进行标注,回到了ChatGPT最开始的LHX状态,成本会非常高,很少企业能够承担的情况。
DeepSeek有自己非常多的特点,它和我们以前用到的这一系列的能力要强大,模型它是不太一样的,
并不是每个场景都适合使用DeepSeek。我们现在也在做一系列场景上的测试,已经有一些相关答案了。比如对话、问答,并不是很适合。
2.企业内部另外一个巨大的挑战,就是企业内部的工具有没有比外面的这些工具更好用,如Kimi,甚至是豆包,你有没有比它更好用,这是很有挑战的,不那么容易的。如果你内部的工具不顺手不好用,那你可能管不住大家去用更顺手的,那之前内部花了大价钱做的governance,自己部署的这套东西,转身就被绕过去,这是非常容易发生的。
3.幻觉问题。在生成专业医学文案这件事情上,DeepSeek不一定是最好的模型。因为它现在在幻觉排行榜上名列第三,14%多的幻觉。
以后人很多的交互,不再会是搜索的行为,他直接用生成式的大模型,因为人都是懒的,人最大的问题,并不希望在各种搜索引擎上弄一个关键字,然后去检索,我还不知道哪些是真,哪些是假,本身人不具备对于这些知识信息检索和判断的能力。所以生成式大模型相当于就在干这件事情,它帮你用你的问题来进行了思考,用你比较习惯的逻辑链去找了一些答案。这时候你就会像很多的“专家”,所谓的专家打个引号的那种,不就是一本正经的胡说八道嘛。
在医学生成的场景,最重要的就是严谨性。现在有很多的模型,performance是很好的,不一定非得用DeepSeek做这件事情。DeepSeek特别适合干的场景是去陪着大家做哲学,做心理,聊天,幻想,陪伴。
从靠谱不靠谱生成拜访内容的角度,我的结论是认为DeepSeek不是最优的,可能只是润色。每一家模型公司的训练方法都不一样,所以每一家吐出来结果都是不一样的。这个东西谁来监管,我们自己怎么能引导这些大模型,所以公司自己本地部署模型,用自己的知识“喂”它,看能不能生成我们想要的内容,这也是技术活儿。
医疗行业是一个严谨的事情,最重要的是定标准,定监管,定测试,怎么样去持续地监测。
专家访谈:医疗+AI落地成熟度分析
价值投资理念、知识经验学习与交流平台,投资风险教育平台。
发现价值,践行价值。书会长期开展独立投研活动,定期发布原创研究报告,组织线下分享活动。
“行稳致远”,秉持“专业、谨慎、诚信”的精神,努力与会员和客户共同实现长期价值稳步成长。
来源:巴菲特读书会周立秋