摘要:当全球产业格局和竞争形态重塑之时,AI将如何发展?11月6日,在第八届世界声博会暨2025科大讯飞全球1024开发者节发布会上,科大讯飞董事长刘庆峰以《更懂你的AI》为主题,给出了清晰回答。
当全球产业格局和竞争形态重塑之时,AI将如何发展?11月6日,在第八届世界声博会暨2025科大讯飞全球1024开发者节发布会上,科大讯飞董事长刘庆峰以《更懂你的AI》为主题,给出了清晰回答。
发布会上,讯飞星火X1.5发布,在数学、多语言等核心能力上持续突破。刘庆峰指出:“迄今为止,在中国主流大模型中,讯飞星火仍然是唯一基于国产算力训练的通用大模型。”
在自主可控的核心源头技术底座之上,软硬一体是科大讯飞AI红利兑现独特而清晰的落地路径。通过将讯飞星火大模型与麦克风阵列、扬声器系统、显示与摄像头等硬件深度融合,AI不再停留在电脑屏幕和APP应用上,而是真正深入到家庭、学校、医院、汽车和各种各样场景中,去解决“真问题”。
而这一切的最终指向,是让AI迈向“更懂你”的价值阶跃。“懂你的AI”就是要懂你的成长、懂你的工作、懂你的生活、懂你的情感,让每个人都能够站在AI的肩膀上释放独特价值,成为更好的自己。
以下为刘庆峰演讲实录:
尊敬的各位来宾、各位开发者朋友,欢迎来到2025科大讯飞全球1024开发者节现场。
一直以来,我们见证了人工智能不断发展进步,日益深入地改变世界的生产和生活方式,尤其是过去3年,以大模型为代表的通用人工智能在全球蓬勃兴起。在千行百业被日益深刻改变的同时,如何让每个人能够获得更大的时代红利?如何让AI成为生活、工作助手的同时还能继续保留每个人的特色和人格魅力?如何让AI懂我们自己、家人的成长和健康需求?
这就是今天发布会的核心主题——更懂你的AI。我们希望让每个开发者、每个用户,都能够共享AI发展的时代红利,那就必须让AI更懂每个人的特质和需求。过去一年,AI蓬勃发展的速度,可以说是历次技术革命从来没有达到的节奏和速度,中国生成式人工智能的用户规模去年底达到2.49亿,已经引发大家的惊叹,到了今年6月已经超过5亿多。
今年的世界经济论坛《2025年未来就业报告》指出,未来五年AI即将取代900万岗位,也将催生1100万新岗位,怎么定义职业、能力数字模型、培训标准以及职业测试方法等,这正是我们的教育在AI赋能每个人的过程中要探索的问题。从产业和资本角度看,今年上半年新诞生的全球54家独角兽公司中,57%是AI相关的公司,可以说占了未来全球最顶尖公司的半壁江山。
星火行业分析师首获工信部考试认证300+智能体重要岗位创造巨大价值
在这过程中,讯飞星火大模型在各行业深度落地,除了教育、医疗、汽车这些行业持续保持行业第一、扩大领先优势之外,2025年前三季度,央国企的大模型公开招标市场,科大讯飞再次蝉联第一名,超过第二名和第五名的总和。
更重要的是,我们看到越来越多的智能体在越来越多的重要岗位创造巨大价值。截至2025年10月,国家能源集团“智能评审系统”,累计评审超18万单,评审准确率97%,年均产生经济效益19亿元。
今天大家都在考虑大数据分析师,作为公司战略咨询专家、地方经济发展的关键分析顾问,大数据分析师越来越重要,国际能源的态势、国际粮食价格怎么变化,怎么受政治、经济、交通、气候的影响都能够精准分析,也是大家对AI在发挥全局性、战略性指导意义的期待。
就在几天前,“星火行业分析师”通过了《大数据分析师技术水平考试》,得分92分(满分100分),超过85%的人类考生,是国内首个参加并通过工信部教考中心技术水平考试的行业分析AI应用。
科大讯飞已经联合央国企打磨了300多个“开箱即用”的重要岗位智能体,涵盖能源、汽车、金融、电力等多个行业。
2025年科大讯飞AI开发者大赛有几个数据也令人兴奋:一个是参赛队伍再创历史新高,来自17个国家、325座城市的36898支队伍参加。其中有50多个团队是跨国组队的,AI让世界更紧密。我们在东盟博览会期间发布覆盖东盟十国语言的星火东盟多语言大模型底座,就有非常多的东盟团队和中国团队联合组队。
智能体是联动人工智能各项特定能力与当下生产生活、并以此完成相对复杂任务的平台,本次参赛的4622个垂类智能体中,有近一半团队并无技术背景,这也说明会编程、拥有专业技术背景似乎并非关键,在具备基础科学认知的前提下,更重要的是对AI的把握能力,是灵感、创意、想象力以及对需求的敏锐洞察。
今年,团中央高度重视人工智能发展,在“挑战杯”赛事中与科大讯飞联合发起智能体大挑赛,吸引366所院校的676支团队参赛,之所以选择与讯飞联合发起,核心在于我们是当前中国主流大模型中唯一实现全国产、全栈自主可控的平台,且智能体在各行业的应用深度也是最深的。
AI红利兑现四大关键核心自主可控、软硬一体、行业纵深、个性化
今年以来,亚马逊是美国硅谷在美国的纽交所和纳斯达克市场上增速最快的科技公司之一,杰夫·贝索斯一度成为美国冲顶的首富,可是他刚刚宣布裁员3万人。今天拥有单一技能已经变得越来越危险,必须要有综合的素养和能力。为什么要做“更懂你的AI”?(因为)我们不能在技术发展越来越快、能力越来越强的时候,找不到人类的价值。
更懂你的AI,让每个人都站在AI肩膀上发挥他独特的价值,避免同质化内卷,让每个人都站在AI肩膀上绽放,让世界更加丰富多彩,每个人有成就自己的空间和舞台。这既是我们的使命,也是我们的初心。
在人工智能蓬勃发展的当下,AI产业红利的充分兑现还需哪些突破?
我们看到,如今不少开发者的产品不仅面向国内市场,更要推向全球——AI产业生态究竟该建立在自主可控的坚实地基上,还是把大楼建在别人的院子里?产业红利如何跳出手机、电脑等传统载体,落地到更多生活与工作场景,同时深度对接工业生产?机器人怎样摆脱“玩具”标签,真正成为生产生活中的实用助手?智能体又该以何种方式深度理解行业,在工业体系中切实发挥作用?
我们认为,AI红利兑现有四个关键核心:自主可控、软硬一体、行业纵深、个性化。
讯飞星火X1.5升级发布自主可控+多语言助力企业出海“有底气”
首先来看自主可控方面的进展。2023年,我们和华为共建了中国首个万卡国产算力集群“飞星一号”,在这个国产算力基础上我们训练出来中国第一个全栈自主可控的大模型——讯飞星火。
今年以来,科大讯飞再次攻克国产算力训练的两座大山:一是攻克长思维链强化学习训练效率,深度推理训练效率从30%提升至84%以上;二是攻克MoE模型全链路训练效率,实现大幅提升。
30%是什么概念?别人训练一个模型需要三个月,我们训练一个模型需要一年,人家要五千万美金,我们要几亿美金,这个仗就没法打。我们有着像华为这样的英雄团队,加上科大讯飞对人工智能底层算法的深度洞察和创新能力,联手解决了大量的算子库的优化、平台适配优化等问题,在这个基础上,我们在全国产算力平台上训练出深度推理大模型讯飞星火X1。
在过去7个多月时间里,我们又攻克了国产算力MoE模型全链路训练效率。什么叫MoE?如果说传统大模型是一位无所不知的全能天才,有一个“超级大脑”,但每次问他问题,他都得动用整个大脑,非常耗费精力(计算资源),而且他的知识容量总有上限。MoE模型就像一个由多位顶级专家组成的委员会,当你提出一个具体问题,会有一个专家来分析你的问题,其他专家此时可以休息,不参与工作。MoE模型可以实现效率的极致优化。今年3月份,MoE模型的训练效率只能达到英伟达A800卡的30%,我们现在把它提高到93%,这两个都是在国产算力平台上从0到1的重大突破。
再来看原创性技术突破:我们全球首发了非自回归语音大模型架构,实现推理效率的大幅提升。非自回归语音大模型与传统自回归模型逐字顺序生成文本不同,能够并行、一次性输出整个文本序列。全世界都在用自回归模型,而我们用了非自回归模型,把语音大模型的训练效果相对提升16%,推理成本大幅下降520%。该项技术已经应用在讯飞输入法15.0版。
正是因为持续的技术突破,我们的全栈自主可控大模型不断进步。迄今为止,在中国主流大模型中,讯飞星火仍然是唯一基于国产算力训练的通用大模型。在这个硬科技输不起的人工智能时代,我们为中国的大模型国家战略托了底,主流大模型的定义就是:国内通用大模型APP下载量排名前十,或大模型招投标市场份额排名前十。
在十大模型外,我们也没有看到第二个有影响力的模型是通过国产算力训练出来的,为什么?因为太难了,有太多的“坑”要踩,还会影响到模型训练。如果没有真正底层创新的能力,就不敢用国产卡,发现问题也解决不了。讯飞做到了的原因,既有讯飞对自身的核心技术、创新能力的自我期许和自信,也有家国情怀的初心鞭策,还有像华为这样的伟大公司的联手推动。
今天,我们正式发布讯飞星火X1.5,大家现在就可以在APP上下载,体验最新的能力。
给大家概括一下它的能力,在全栈自主可控模型参数小一倍的情况下,我们是293B的MoE模型,就是2930亿的模型,激活之后是30B,就是300亿的模型。为什么选择这个参数?因为我们的用户在这样的模型架构上,如果医院、学校、政府机构、央国企单位要用它,只要购买一台标准的国产昇腾服务器就可以部署这个模型,而其他的MoE模型至少两台才能部署。
在这样一种性能、成本优化的前提下,可以看到讯飞星火X1.5的语言理解、逻辑推理、数学能力都是与业界主流最好的模型GPT-5(high)版来对标,和国内很多大模型比,我们的指标也是排在最前面的。
再往深度一点看,比如数学,数学绝不只用在教育上,还用在AI for Science的复杂计算、行业分析师以及各行业的纵深领域。今年6月8日高考数学一卷解密的时候,第三方的权威机构就做了测评,把国内六个最主流的大模型和OpenAI o3放在一起测。高考数学一卷我们得了141分(满分150分),我们跟DeepSeek V3.2-Exp是仅有的两家过了140分的大模型,OpenAI o3是138分,其余大部分大模型是120分左右。经过这次升级,数学一卷我们已经可以得147分,在综合的各类高考卷子中,讯飞星火X1.5能得145分,美国最好的模型GPT-5(high)是141分,DeepSeek V3.2-Exp也进步很快,是140分。
真正难的题目是用来区分谁是真正的高手,在这次高考中我们表现最好。所以,我特别想用数学举例,不像知识问答,今天错了,补一个问答就可以做对,对于数学,不会就是不会。总体来说,数学是真正能看到大模型深度推理能力的一个标志。
在各种各样的国际数学奥林匹克竞赛中,讯飞星火X1.5均表现很好。一些问答中,你去提问,不要过度推理,讯飞星火X1.5能给你简洁而正确的答案。讯飞星火X1.5这些能力的提升,对我们下一步在重点行业落地有非常重要的战略意义。用国际数学奥林匹克竞赛的题目举例,需要对数论和方程有比较好的理解能力才能做好,从简单推理入手,不断扩散开来,最终找到合理路径的过程。国际和国内所有主流模型都做不出来这道题,但我们能做出来,讯飞星火X1.5在这类推理题目上有更强的能力。
正因为有了底座模型,所以我们才能在小一个数量级的参数下和国际最先进的大模型进行对标,在行业大模型中的领先优势才能进一步扩大。今年10月份互联网教育智能技术及应用国家工程研究中心发布的《教育大模型“成绩单”公布:谁是最懂教学的AI》,我们的教育大模型是第一名且领先优势不断扩大,在教育领域中用于辅助教学、辅助学习、辅助考试、辅助评价和辅助管理,综合成绩过了90分。85分是一个门槛,在业界能过85分的只有几家,而我们显著领先第二名。
医疗上的领先更加明显,基于讯飞星火X1.5,星火医疗大模型在医疗的语言理解、诊疗推荐等功能上远超其它模型,平均分已经达到91分以上。
在行业模型不断进步的基础上,我们也在不断为世界提供“第二种选择”,讯飞星火的多语言大模型能力持续升级,我们的战略生态位和使命就是:自主可控对标全球顶尖,行业模型做到全世界第一,多语言模型为世界提供“第二种选择”。
现在我们可以支持超过130种语言,整体性能达到最新的GPT-5(high)的95%以上,确保不出现代差,在最迫切需要的行业中还要实现超越。在底座模型层面,针对拉美、东盟等与中国关联密切的重点国家和地区所需语言,我们以14种语言覆盖超过60个国家和地区,且已实现效果领先。
想要实现很好的翻译能力,不光要单个语种做得好,还需要多语种联动的基础。在今年的国际数据公司(IDC)《中国AI翻译技术评估》报告中,星火语音同传大模型在所有8项指标:推荐度、翻译速度、翻译效果、专业度、拟人度等都是行业第一。
今天,这么多开发者关注讯飞的技术进展,我特别自豪地告诉大家,中国的开发者们只要用讯飞星火,出海再也不用担心“卡脖子”了!
AI+麦克风、扬声器、摄像头、视觉呈现
“软硬一体”独特路径让大模型“真”落地
结合刚才提到的自主可控进展与底座模型,大模型应用落地红利兑现的第二大关键是“软硬一体”——核心在于让大模型跳出手机、电脑等传统设备,走进真实生活场景,在各类智能终端及家庭设备中充分发挥作用,这也是AI在真实世界应用落地的关键。
这个关键中当前最欠缺的是有没有麦克风阵列?能不能远距离多人说话都能听懂?与机器人或智能设备沟通能不能不需要操控和触摸?能不能用扬声器阵列,在一个小小汽车空间、在教室里面营造出来大剧院式的声场效果,让每个角落都能听得清?能不能用摄像头阵列,不仅能听懂声音,还能看懂手势、知道现场环境,用更护眼的方式来呈现?这是四个最重要的大模型落地的需求。
在过去的几年中,科大讯飞最重要的一件事情是在全国产平台上实现软硬一体化,把硬件能力和大模型深度对接,然后形成了AI+多个硬件系列的创新技术。
例如,我们原创了AI+麦克风阵列技术,不是简单的硬件布置,是基于AI的测算和动态调节使用激活相关部件,实现了语音属性解耦,不同的人讲话可以解耦,噪音和人声解耦,信号的时空分离,不同位置上的声源精确定位,自适应的背景降噪,回声消除以及说话分离等技术。
给大家看一个例子,科大讯飞智能办公本X5 Pro和iPhone17 Pro这两个设备在远场抗噪的情况下怎么样?如果背景噪音不断加大,谁能听得懂?如果放在3米、5米之外谁能听得清?来做一个真实的测试。
这就是我们在办公本上首创的上4下4环麦克风大阵列,办公本今年“双十一”到目前为止都是销量排行榜的冠军,很多人都在使用。为什么用iPhone进行比较?因为它一直把语音作为非常重要的核心能力。如果在几米之外却没法操控,无论你有多聪明的对话系统,多聪明的生成能力,都没法在真实生活中发挥作用。可以看出,远场高噪情况下,我们的技术在国际上有显著领先优势。
再看刚刚推出来的讯飞AI翻译耳机,用了“骨导+气导”双拾音降噪,首创单耳三麦多感融合降噪系统。拿苹果最新第三代耳机AirPods 3来比,在食堂、地铁等80分贝的高噪环境中,它的识别准确率达到97.1%,而苹果耳机识别准确率是77.7%,这个耳机不仅有最好的翻译能力,还有最好的降噪能力,戴在耳朵上也很轻巧。
我们在今年大阪世博会上还发布了新一代双屏翻译机,其中特别重要的一个亮点就是独创了强降噪模式,1米以内穹顶式隔音。当我听到主席台上甚至听到更远的人讲话的时候,照样可以翻译;希望两个人交流的时候,一米之外无论多吵,都不会有干扰,就可以直接启动穹顶式隔音。
穹顶式隔音的能力和水平,绝不只是翻译机上使用,在各种需要降噪的(工具)上都可以使用。
在噪音环境下如何精准去除噪音、把声音有效提升、精准听到远距离低分贝的声音、进行更有效的分区域的隔音等等技术,都是大模型以及人工智能要应用在我们日常生活中必须解决的技术。很高兴地告诉大家,这些技术科大讯飞不仅是全球第一,而且很多技术都是我们独创的。
在这个基础上,我们还推出了业界首个软硬件一体的同传麦克风。
这个同传麦克风可以非常快速,2秒内低延迟地、精准地进行同传后的语音播报,因为要解决离线问题,目前拥有10种语言能力,将来要做到上百种语言。现在讯飞星火支持的语言已经有130多种,翻译机的离线语言将近20种。同时还能私有化部署实现完全加密,在单边会议、多边会议、外事会见、餐叙交流中都可以充分使用,让AI翻译机来翻译,就不会丢失相关细节,信息更全面、谈判更精准。
还想和大家分享的是软硬件一体在汽车上的应用效果。
在奇瑞的汽车上,我们已经有很多来宾体验过剧院式的临场音响效果,自研的扬声器的硬件设计技术和低音炮效果用合理的方式进行组合,用更轻的、更好的材料进行设计,并联动AI算法,实现相位校准和延时同步、声场重建及控制、动态范围的压缩和均衡以及车内声场空间的环境渲染等,能让你听到更清楚的细节,听到更棒、更保真的音效。
它还能分区,驾驶员讲话,后面的乘客可以不受干扰,后座讲话驾驶员都听不见。有人看大片,有人听新闻,有人听音乐,各不干扰。在汽车中,我们支持46个高品质声学单元,通过AI后台自动联动,声音的隔离度超过了22dBA,声能量的隔绝率超过99.3%,只留出不到1%的声音能听到,只要不是故意大声说,其他位置根本听不见。
到今年9月,我们iFLYSOUND智慧声场产品的累计出货量已经超过100万台,明年单年就会超过100万台。
11月5日,我们在合肥大剧院上演一场“听觉盛宴”,虚拟现场的音响效果令大家非常激动。我们的合作伙伴奇瑞等车企开展过盲测,在不知道是谁的设备(的情况下),请用户来测。售价15万元的奇瑞车搭载了iFLYSOUND智慧声场,音效效果可以超越宝马740i,媲美最顶级豪配的迈巴赫S680的效果。
我们打破了过去30年车内音响所有关键组件要依赖进口的情况,实现100%国产化,欧洲的一些顶尖的音响硬件品牌现在想要搭载奇瑞的“伯牙之音”(背后的技术)。这个技术结果就是软硬件一体所带来的“魔力”,绝不仅仅是硬件的创新,还要跟AI深度联动,才能做出原来根本没法想象的事。
科博展的展位上,在全球首发的AI黑板上,因为有24通道的AI扬声器阵列以及和教室场景的均衡处理能力,让同学们在教室每个角落都能轻松听清。
原来,在前排的同学听的声音太大,时间长了会损伤大家的听力,而后排的同学听不清。现在,我们可以做到,前后排10米空间声压差小于3dB(20米房屋蚊子的叫声大约20dB),让孩子不再担心困扰,再也不会出现老师用一个“小蜜蜂”回声听不清的情况。
在声音播放中的声场重建的能力,已经在汽车和教室中深度落地。
再进一步讲到“显示”,10月24日,我们发布了新一代讯飞AI黑板,是全球首款、经过欧盟认证和国内各种各样的护眼认证的圆偏类自然光护眼大屏。
这个大屏的特点是什么?
它能让教室任何角落的孩子都看清黑板——过去坐在中间的孩子看黑板看得清晰,坐在边角就看不清,而AI黑板的130度视角可完全覆盖教室各个角落,让每个孩子都能看得清清楚楚。
它不仅视觉效果出色,还具备深度护眼能力,能通过模拟自然光、合理提升并均衡亮度视角等功能呵护视力,最终让教室里的每个同学,无论“听”还是“看”,都能拥有C位体验。
除此之外,科大讯飞AI学习机上已经有了专门的护眼模式,不仅有微纳米类纸屏防止眩光、高透更清晰,还有AI环境光检测算法,让直频调光无频闪,充分护眼,获得了国内外10多项的护眼认证。
AI除了在显示中结合,还能对坐姿进行自动判断。孩子坐得过近,姿势歪斜、躺着看书等,AI全部能自动提醒,全方位护眼。
屏幕是孩子以及我们每一个人接触世界的窗口,很多人说近视眼是中国中小学孩子最大的健康问题,10年之后,因为刷视频、刷手机时间太多,非常多的人眼睛会出大问题。在护眼上,我们有了软硬件一体化和AI的对接,这也是让最好的大模型进入到每个人身边,来到更多场景使用的关键。
除此之外,我们还专门打造独家的AI+摄像头阵列技术,能实现目标的精准识别与实时跟随。云台摄像头内置全栈自主可控的芯片与AI算法,即便跑得最快的人也无法脱离其跟踪与识别。
我们可以在车内外云台,做视线估计、图像弯曲矫正、360度环视拼接、多摄像头跨视角追踪、拍照识别等功能,这些东西组合起来就是软硬件一体。通过视频摄像头阵列、麦克风阵列、声场、显示来构建AI融入真实世界的物理基础,硬科技创新融入以后,这个物理世界的人物是什么样的?我想带大家感受一下。
首发个性化记忆能力和百变声音复刻
超拟人多模态交互是AI进入每个家庭的标配
今天为什么有很多的虚拟形象、APP没法进入到日常生活?
一个真正的多模态交互技术要具备哪些东西?麦克风的远场识别(在远距离、高噪声的环境下精准语音识别),3D视觉感知(比如知道你给他做的手势是暂停还是表扬),多人主动交互(数字员工要像真人员工一样提供服务,对于见到过的朋友、董事长、员工、客人等可以非常清晰地判断出来),有类人的举止反馈,能够进行视觉、听觉融合理解(把麦克风和摄像头完整组合在一起理解),实现超拟人数字人,还要有个性化记忆和有情感语义的理解,有了这些技术的综合联动,我们的AI就不再是一个简单的APP软件了,可以更有情感,更有深度。
这次在讯飞星火深度推理大模型X1.5中,首发了个性化记忆能力。通过多语言的信息检索和相关的应用,能够找到相关用户的个人记忆(包括个性化的记忆识别,提取以及更新),可以画你的人设。
比如现在有一辆奇瑞新能源汽车,对汽车标注“新能源”,你说汽车要去续航,就知道需要到加电站去。如果最近生病了,就会提醒你最近要注意哪些问题。包括个人的学习和工作资料库,使我写出来的内容和别人不一样,更符合我的要求。
这些整体个人的资料和画像,基于对话反馈的进行动态更新,是讯飞星火X1.5非常重要的特色,用户都能感受到,而且在持续深化。
另外,业界首发百变声音复刻能力。当年模仿林志玲,要到台湾录一个礼拜的声音;后来模仿郭德纲,要录一天;后来复刻声音需要一小时语料,到现在录制一句话就可以模仿,技术在迅速进步。
原来的一句话模仿,你读的什么腔调,生成的对话也是这个腔调。现在,技术进一步提升,用户可以随意定义自己要的风格,马上自动生成。也可以录制一句话后,用这个声音生成各种各样的风格,而不受限于讲这个话的风格限制。
刚才给大家看到的超拟人数字人的多模态对话,不仅要有硬件的麦克风、视频摄像头和AI的联动,后台一定要有超强的大模型多轮对话、指令跟随、语义语解和生成能力,再配合超强风格的个性化音色,才能把看起来同质化内卷的大模型变成每个人都喜欢的、身边的学习和工作助手。这些技术在业界踏踏实实往前走了一步,无论是语音识别的效率和水平,还是语音合成,我们在业界都是代差级领先。
未来,超拟人多模态交互将是AI进入每一个家庭的标配。
为什么要花这么长时间和大家说这个事?因为开发者都面临着一个重大的机会。大模型红利兑现,我们有更有力的手段和底层技术,让它能够帮助到每个人,也能赋能到每个行业。
更懂你的AI“工作、生活、成长、情感”通通都要
我们这次发布会的主题叫“更懂你的AI”,要让每个人站在AI肩膀之上,而不是在关键能力上被AI替代。我们的个人特质再加上AI,会使它更有风格、更有特色,也比通用的AI更吸引人、更有个人魅力,同时也更懂我们的需求,无论是教育成长还是健康需求。
什么是“更懂你的AI”?
根据认知心理和发展心理的相关理论,大致把每个人的需求分为工作、生活、成长、情感的需求。
人们要追求进步和自我实现,AI要懂他的潜能,因材施教,帮助他成长;在工作中,人们要追求效率和成就,AI要懂逻辑、懂任务,帮他提效,而不是简单地做一个大家看起来好用、第一眼惊艳,但是没法落地的东西;在生活中,人们要追求安全、追求稳定、追求愉快和健康,AI要懂健康、知习惯;人们有情感需求,追求良好的关系与深度的理解,AI要懂语言、能共情。
这些是“更懂你的AI”的基本要素。
我们今天打造“更懂你的AI”,需要有历史记忆、人格特征、多维理解、专有知识。
这样一个非常抽象的、涵盖面如此之广的“更懂你的AI”,怎么让大家体验到,我通过一些应用给大家解释。
比如说教育,怎么更懂孩子的成长?
最关键的是怎么样给学业减负增效,腾出更多时间去玩、去锻炼、去发展自己的兴趣爱好,那么最重要的是要懂学情。我们做了整题评分技术,不仅做到业界领先,还在持续扩大我们的领先优势,已经达到高考级阅卷的要求。
在此基础上,我们做了分步骤批改技术,能分析到底哪一步、哪一个环节出错,在业界首次达到实用门槛。今天,我们又率先在全球实现了基于分步骤批改作业的错因分析,告诉孩子是什么原因错的,应该从哪些维度去复习,去提升自己的能力。
我们首创了“三级错因体系”,从一级错因是知识掌握、思维方法、解题习惯,二级错因有公式混淆、方法选择错误、书写不规范等错误,再到三级具体知识点错因,整体呈现出三大类三层级4000多个错因标签。
这个错因体系经过了非常严格的一线验证和专家测试,最近国家义务教育数学课程标准修订组组长曹一鸣教授专门带领专家组做了鉴定,认为体系创新引领、科学严谨,错因诊断水平超过了普通老师,已经可以使用。
今天我们再次以软硬件一体化的方式去实现:首先是放在桌面上的星火智能批阅机,不仅能够批改作业、给出错因分析;再到通过星火教师助手给老师推送复习策略,及时调整课件;最后老师可以基于AI黑板实现精准教学。
这背后,既要有最好的教育大模型,又要有软硬件一体化的星火智能批阅机和AI黑板。
我们和很多教研组老师沟通,他们特别兴奋的一件事情是什么?
现在老师的工作任务很多,孩子头一天的作业老师在第二天晚上才有时间批改,批改完之后才能发现孩子的薄弱点,但这中间有一天的时间差。有了星火智能批阅机,早读课之前作业收上来,早读课结束,老师上第一堂课的时候,学情分析报告就已经拿出来了,真正快速联动前一天学生的作业和第二天课堂教学,实现作业批改到教学的小时级闭环,使得按照知识习得的教学顺序能够更合理地往前推动,对教育的均衡和教学质量的提升意义非常重大,可以说,这会引领一场教学范式的变革。
在教育领域,我们还在推动一件更有温度的事情——AI老师。孩子的发展有其自身规律,有时候跟孩子沟通完全靠讲道理是很难的,更多的是要用情感去打动他,一个好的老师可以让孩子爱上学习。
什么是一个好的老师?我们做了很多调研,也问了很多专家和学生,说需要亲切、阳光、爱笑、幽默,还想要善于鼓励、有同理心、有耐心、能够因材施教的老师——要求很宽泛,大概每个人心中都有一个自己想象的最好的老师。
根据普遍特征,我们研发了更有爱的AI老师。
有AI技术做支撑,这个老师不仅能完成因材施教,还十分有亲和力、有耐心、善于鼓励孩子。如果有这样的老师,学习热情会高涨很多,也可以防止“不辅导作业母慈子孝,一辅导作业鸡飞狗跳”。这个AI老师,即将入驻科大讯飞教育产品。
还有一个大家特别关注的——什么是“更懂你的健康”。
AI要有最好的医学诊断能力。但它不是替代医生,而是帮助医生一起做更好的服务。AI知道你本人、父母亲以及孩子的健康档案,包括每次体检的变化,就能做健康管理、咨询和就诊前的各种各样的咨询和服务,诊后的身体调养和相关跟踪。
讯飞智医助理到目前为止仍然是独家通过国家执业医师资格考试的人工智能系统。当年考了456分(满分600分),现在可以考到520分以上,超过了99%的考生。目前智医助理已经为4.9亿份电子病历给出了11亿次的辅助诊断,修改了186万不合理的诊断,和1.1亿不合理的处方提示,把基层的诊断合理率从70分提升到96分。安徽每一个村医工作室、乡镇卫生院和社区医院都在使用,全国已经有超过800个县区在使用。
今天,我们结合星火医疗大模型,再次升级智医助理。覆盖病种从2000种拓展到2500种,首诊合理度从95%提到98%,还新增了医学思维链循证推理,展现给医生和患者,让他更了解逻辑而不是简单给个结论,并且新增中医辅助诊断。
现在,智医助理每天在一线给超过100万的病人提供诊疗服务,有了智医助理,每一个普通老百姓都可以享受最好的全科医生服务。也是因为每天上百万次的辅诊,形成了很好的数据飞轮,所以智医助理越来越聪明,越来越好用,在国际上,医疗大模型的领先优势不断扩大。
这些能力从基层进一步延伸,已经往等级医院提升。在病情更复杂的住院场景,星火医疗大模型无论是准确度、完整性还是实用性上已经达到等级医院主任级医师水平。
今天,星火医疗大模型的能力已经达到三甲医院门诊和住院的水平。当人工智能的能力跟医生结合之后带来的帮助是什么?专科的诊断合理率从87%提高到96%,协助医生看得更全;跨科室诊断合理率从81%提到91%,不仅让医生诊断得更准,还让医生的效率更高;病历书写时间减少50%,很多事情经过对话交流自动生成相关病历,只要最后确认一下就行,大幅提升了等级医院医生的诊疗和服务能力。
这次首发的智医助理医院版1.0已经正式跟很多医院开展了合作,并开始进入医院真实场景中,从辅助诊疗到辅助会诊,再到病历生成和病历质控,从基层到等级医院带来巨大的进步。
我们还升级了讯飞晓医APP,这是每一个老百姓都可以下载的(应用)。看病前问一下晓医,知道应该到哪个科室挂号,带什么资料;吃药前问一问,防止吃错药;体检后问,它可以做前后对比,提醒你生活习惯,帮你解答各种问题。
根据刚才医疗大模型能力提升,我们再一次对讯飞晓医做了升级。升级以后的讯飞晓医APP,特别构建了全新的健康空间,可以把你的健康档案构建得更完整。无论是体检、自己问诊买药还是去看门诊,99%的医学报告讯飞晓医全部都能读懂。
有170种细分标签维度来覆盖个人的基本信息、健康状况、手术用药、疾病以及家族史等等,当出现一个紧急情况,它可以更精准地给出依据你的健康画像做出的分析报告。
健康管理覆盖20余个科室常见慢病及重要疾病,让你在家里就能得到更精细的管理,以及随时随地服务和陪伴。
讯飞晓医现在有1.6亿次的AI咨询,好评率达98%。
今天,中国新能源汽车、中国智能网联汽车的发展这么快,怎么把大模型“做”到车上、在车上更懂你?懂你,知道你的健康、习惯;懂车,懂车内的所有操控,不只是简单的APP聊天;还要懂环境。
当汽车拥有了这样“懂你”的能力,又上了一个很大的台阶。
今天发布的星火智能座舱2.0,懂你、懂车、懂环境,车内的2000+原子化能力都可以(组合)操控,绝不是简单的APP;懂车外环境,什么地方应该停车,外面有没有积水,前方的视觉死角有没有人,都能看到;懂车内情境,懂你的意图,懂你的历史,也懂你的健康。这样一辆汽车,把生活、办公和娱乐都搬上来了,我们再也不用担心堵车过程中的烦恼。
最后给大家看一下,什么是更懂你工作的AI?这个工作中有懂你的岗位、懂你的风格、懂你的资料、懂你的同事。
介绍两个身边触手可及的产品。
一个是讯飞智能办公本,已经连续6年市场品类第一,不仅可以快速地记录,还可以帮你生成各种各样的文稿等。最新的讯飞智能办公本不仅具备超强的抗噪能力,能够在极限噪音环境下仍然保持精准的转写,还可以帮我们生成各种待办事项,并一键办理。
它将来会真正成为我们贴身的办公伙伴、办公搭子。
很多没有办公本的朋友们怎么办?可以下载讯飞听见,它具有讯飞办公本的核心能力。目前,讯飞听见总用户数已经超过9800万。
懂你工作的AI就一定要是自动便捷、越用越好用的,不需要额外再花精力去学习。
最后还有一个彩蛋送给大家,给大家介绍一位讯飞星火打造出来的新朋友,这个朋友是谁呢?
这个“AI星朋友”不是一个概念,而是大家可以扫码体验的。你可以问它,也可以设定需求,它会在特定时间主动打电话给你,它有自己的人设。当前,“AI星朋友”的初步用户周均使用次数9.8次,56%的月活率,正向情绪反馈率达82%。
在这样一个快速发展、极度竞争、充满焦虑的时代,每个人都需要一个懂他的成长伙伴,陪他走向更好的自己。这个AI伙伴,不是消耗元气的信息茧房,而是帮助人们走到更好的真实世界,走向更好的自己。
“AI星朋友”已经上线,大家可以扫码或微信搜索“AI星朋友”小程序,就可以体验使用。
发布首个原生支持RPA智能体平台Astron
“让每个人都站在AI肩膀上”是讯飞初心
我们相信,只有整个生态的繁荣,才有人工智能的大未来。今天我们提到的所有能力,都将赋能给所有开发伙伴,共同拥抱这个未来。
在自主可控的底座上,我们的开发者在过去一年增长了200多万,其中增长最快的是软硬一体的智能硬件开发者,大模型的企业开发者增速更快,达到了125%;新型智能体的开发者有近一半来自非技术领域,现在不仅不用懂软件,也不用懂硬件了,我们有最好的支撑给你做各种参考设计。
针对智能体的蓬勃发展,面向开发者,我们打造了首个原生支持RPA的智能体平台叫Astron。
很多时候,你给智能体讲一段话、提一个要求,它把这段话分解成各种任务,知道找什么样的工具,查找内外信源完成你的任务。但是现在有很多正在运行的工业系统和各种账号体系没有接口,没法拿到,怎么办?假设有十个环节,但凡有一个环节智能体没法突破,就僵在这个地方没法运行,现在我们用RPA自动模拟操作,改变纯智能体达不到的场景中的快速联动,从而实现用“Agent+RPA”跨越AI应用鸿沟,有效打通企业内部缺少接口的IT系统和账号体系,以及卸载运行的各种系统。
这是一个非常大的变化,特别在那些万无一失的场景下,用RPA来补充智能体和Agent是必要的选择。我们在业界打造了首个原生支持RPA的智能体平台,还有八大行业精品智能体,开箱即用,从教育、文旅、机器人到各种智能硬件,法律服务、企业出海、轻办公以及数字员工。
我们想与千万开发者共创生态繁荣,在这样一个人工智能大模型红利兑现的关键时点上,给大家呈现了自主可控、多语种、更懂你的AI、软硬一体和多模交互,从技术能力上给大家更好的支撑,也从情感温度和导向上让大家在“更懂你的AI”上做得更好。
人工智能是硬科技,是强技术竞争,更是有温度的技术,让所有人更好地融入这个世界,带来更温暖、更好的未来。
更懂你的AI,就是在大模型能力快速迭代、不断进步、专业能力超过每个人的时代,让人类站在它的肩膀上成为更好的自己,让每个人独特的闪光点绽放。
更懂你的AI,成就每一个更好的你,这不仅仅是科大讯飞的初心,更是使命。我们期待和所有的开发者们一起,成为更好的自己,成为更好的创业者,创造一个更好的未来,谢谢大家!
*文中数据来源于实际应用
来源:科大讯飞一点号
