天津论道|酷开科技郭尚锋:大屏AI智能体应用实践

B站影视 内地电影 2025-10-31 10:09 1

摘要:本届论道以“视听破圈 智联无界”为主题,围绕产业破圈展开积极探讨。10月30日上午的主论坛上,创维酷开公司 智能系统研究院院长 郭尚锋发表了题为《大屏AI智能体应用实践》的主题演讲。

2025年10月30日-31日,流媒体网主办的「天津论道暨第30届智能视听与科技创新产业论坛」在天津隆重举行。

本届论道以“视听破圈 智联无界”为主题,围绕产业破圈展开积极探讨。10月30日上午的主论坛上,创维酷开公司 智能系统研究院院长 郭尚锋发表了题为《大屏AI智能体应用实践》的主题演讲。

以下是演讲全文:

大家好,很荣幸在这里分享酷开在大屏AI智能体方面的一些应用实践。今天分享的重点核心包含我们为什么要做这件事——其实这已不单纯是一个智能体的应用实践,而是酷开公司如何实现破局的关键探索旅程。

为何All in AI?

核心来讲,酷开公司是以智能电视(创维电商用户运营)为主业,现在之所以要做破局或向AI转型,核心面临的问题很明确:大屏用户日活率下降,互联网营收下滑,这是我们最核心的挑战。面对这个问题,我们内部探索的思路其实很清晰,主要有两个方向:

第一个是如何把用户服务好,通过整体优化让用户变得更活跃,提升用户粘性,让用户“爱开电视、爱用电视”,这是我们的核心目标之一。

第二点是提升公司内部效率:能不能让更少的人做更多的事,或者让现有团队的效率更快,让内部机制更高效,甚至减少不必要的会议。核心就是,如何在新的AI时代下,既提升用户活跃度,又加快内部运行效率——这就是我们实践的最基础思路。

目前,酷开公司希望打造一种端到端的AI架构:用户有什么诉求,内部员工应该做哪些事,不是由CEO或某个高管决策,而是由数据决策,由端到端的AI来判断我们该做什么、做了之后能获得什么样的数据效果,最终反向验证公司某个方向是否正确。这是酷开公司整体要打造AI原生企业的核心理念,即端到端的AI原生架构。

在这个架构中,我们核心做的事情是以AI为驱动。虽然公司提出“All in AI”或“AI All in”的口号,但背后更核心的是如何用数据驱动企业决策、驱动公司运营,以及如何用AI重构我们的产品和服务——判断哪些事情重要、哪些不重要,进而进行重构。而重构的核心目的,是创造更多用户价值。这就是我们做AI、做智能体的出发点:如何让AI在新时代赋能企业,最终实现增长,这是我们最大的战略起点。在这里先做一个简单铺垫,关于我们具体做了哪些事、取得了哪些效果,后面会给大家做具象分享。

我们要打造一个怎样的AI智能体?

首先讲一下整体架构——也就是我们的智能体,或者说我们要做一款什么样的产品、产品定位是什么。目前,这款产品的定位是“家庭私人管家助手”,我们希望通过家庭管家助手驱动大屏及所有价值设备,实现家庭生活陪伴,这是我们的整体定位。

同时,我们产品的核心优势定位是“长记忆、快思考、秒行动”,后面我会专项解释这三个特点的核心内涵。

目前,我们的智能体已覆盖6大专业智能体加上Happy Work智能体,服务终端也不局限于大屏,还包含各种智能硬件,比如毛绒玩具、小屏、中屏,乃至汽车场景等全空间,这是我们核心架构的理念。

刚才提到为什么选这三个点作为核心特点?

先说说“长记忆”。大家对长记忆的简单理解可以是“如何更懂用户”。如果对AI玩具市场有了解会发现,早期AI玩具的核心是让小朋友能与之对话、进行生成式聊天,但后来很多产品因形态等问题难以持续——为什么?因为小朋友第二天就不想聊了。只有当玩具有了记忆,记得小朋友前一天讲了什么,第二天能延续话题,知道“你昨天说过这个,今天又来跟我聊啦”,小朋友才会愿意持续互动。

从这个小场景能看出,长记忆是“更懂用户”的关键。从小玩具到大屏设备,“懂用户”不仅要知道用户的长期偏好,还要了解他们短期追的剧、行为喜好和习惯。而我们的核心技术,就是如何把用户复杂的大数据行为进行抽象、整理,转化为大模型的记忆——即把用户行为数据变成一份可存储、可调用的记忆。

第二点要讲的是“快思考和秒行动”。什么是快思考呢?准确来说,其核心在于能够理解用户,明白用户在说什么、想要做什么。

接下来讲讲秒行动。我们提出秒行动这个概念,核心原因是在大屏交互过程中发现,使用大屏的用户中老人和小孩居多。我们之前推出过一款名为AI绘本的产品,产品刚上线时,整个绘本的加载速度要30多秒,结果发现很多小朋友不爱用。为什么呢?等待时间太长了。当我们把AI绘本的交互响应时间缩短到十几秒后,发现用户的使用率和活跃率至少提升了50%以上。这是因为有了实时反馈。我们电视机前的用户很难有耐心去等待一个长达三分钟甚至更久的行为,所以如何做到服务的快速响应,就成了我们最核心的主题。这三个要点,也成为了我们整体架构中三个重要的核心点。

技术架构和产品交互完三大升级

我们的智能体从去年正式投入研发,到今年已经进行了重大升级。在这次更大的升级中,第一个要点是包含了重大的生态服务。早期,我们的智能体可能只聚焦在影音本身,那么在当前环境下,能否与本地生活服务相结合呢?能否在完成基础影音功能之外,还能提供本地的一些服务,比如政务服务、水电燃气基础缴费服务?甚至家里家电坏了,能不能上门维修?只有做到这些,才算是真正把智能体当作管家放进了家里,而不仅仅是满足用户“我想看个电影”这种虚拟的需求。比如家里灯泡坏了,智能体能不能自动链接到背后提供上门服务的厂商,上门把灯泡修好?这才是一款真正为家庭提供服务的智能体。

所以,在生态服务闭环方面,我们合作了很多方面。一方面是与大型生态机构合作,比如阿里这样的本地生活服务提供商;另一方面是与广电网络体系中的一些本地生活服务进行合作,这是最大的一个基础点。

第二点是管家式的主动服务能力。什么是管家式的主动服务能力呢?我们进行了深入的思考和研究,给它下了四个定义。

第一个是能听懂用户的话,这是最基础的。

第二个是能完成大部分基础服务的闭环。什么是大部分基础服务的闭环呢?首先,我们要明确智能体不是万能的,不是你让它做什么,它就一定能百分百立马完成,就像我们的大模型,现在感觉它好像什么都能做,但又好像什么都不能做,只能给出提示。但我们要做到的是能完成基础服务的闭环。就像你找了个秘书,你说“我明天要去天津出差”,他能不能帮你安排行程?如果连机票都不会帮你订,酒店也不会帮你定,那你就会觉得这个秘书不合格。如果大模型只是告诉你“你去美团或者去哪儿订”,这样完全不够。只有完成这些基础的服务闭环之后,才能让我们感觉生活是智能的、便捷的。

同时,它可能还能在多轮指导下完成复杂任务。针对一些复杂的任务,它无法直接完成。比如你可能让它做一个旅游规划,说“我想去新疆玩,做一个旅游规划”,它可能会帮你出具规划,但这份规划不能直接让你去落地执行,因为它不知道你到底带几个人去玩,你的预算是多少,住宿有什么偏好。它需要跟你进行多轮沟通,在你的指导下完成任务,这才是一个合格的智能体。所以,它能够自动在多轮指导下完成任务,这是我们的一个核心。

最后一点是能够协同其他智能体工具。因为我们的所有智能体应该是能够成长的,能够根据生态平台接入的服务自主成长。比如今天接入了地图服务,明天接入了外卖服务,后天又接入了其他本地生活服务,它要能够自动知道接入了哪些服务,并自动调动这些服务,知道自己成长了哪些能力,从而变成一个成长的管家。这才是一款真正能为家庭生活带来便捷的智能体。所以,我们对智能体的管家式能力做了四大方面的定义。当然,对它的行为评级也做了定位,目前主要在3级到4级,主要是由人力在监督,它能够自动分解任务,但不完成部分任务。

同时,还有一个最核心的点,就是实现无界空间场景闭环。它不应该仅仅局限在我们的电视大屏里,而应该延伸到我们的手机上、车载设备上、穿戴设备上。比如我们在大屏上做了一个去新疆旅游的计划,做完之后觉得这个旅游规划很核心,但当你飞到新疆后,发现这份旅游规划还留在电视机里带不走,到新疆后它无法指导你去哪里住、去哪里吃。我们认为这不应该是这样的。我们应该让智能体成为背后一个虚拟的数字管家,就像一个数字分身一样,它能够在你的各个终端里实时提醒你今天该做什么事情、哪些事情能让你的生活变得更便利。这是我们对整个智能体验能力的一次重大升级。

我们整体的智能架构核心:以一个超级智能体为核心,背后调度N个专业智能体,同时实现跨设备灵活显示。无论是大屏、手机、智能终端还是其他设备,都只是信息承载与显示的载体,作为交互的输入输出端口。以上是对整体架构的简单分享。

再说说“无界跟随”的核心——智能体可在所有设备间无缝联动。比如你到了天津,打开手机 APP 就能收到当地美食推荐,服务全程联动;在电视上没看完的影片,打开手机智能体就会提示续播。这就是真正实现服务无界跟随的核心价值。

数字管家 + 极简交互 + 场景化“聊天 + 服务”模式。用数字人承载聊天功能,是为了在人机交互中建立虚拟服务形象,占据用户心智,且能跨终端存在;极简交互仍以语音为核心,它是大模型领域成熟且重要的赛道,告别以往层级式操作,无需关注功能所在APP,零层级对话即可完成服务交互。

更具深度的拟人化数字人。一方面通过语音、动作、眼神打造便捷交互,另一方面核心是搭载深度知识库——不像多数仅靠技术合成的数字人,我们的数字人经过专属训练(比如学习创维黄老板的内容风格后,推荐影片、分享经验时就像本人交流),能提供真实情绪价值,让用户愿意主动沟通。

AI助理以“聊天 + 服务”为核心,既满足用户情绪价值,又实现功能价值,这才是数字人的成功关键。如今情绪价值更受新一代用户关注,我们已具备成熟的拟人化数字人技术与平台。

在交互体验上,变化也很明显。比如之前说“想听邓紫棋《泡沫》”,右侧只会出现歌曲;现在除了目标歌曲,还会同步推荐邓紫棋的最新作品、相关视频,推荐更具关联性。

场景落地:AI如何重塑大屏价值?

第一个是互动投屏功能。过去我们误以为电视是家电核心,但实际用户离手机最近,如何让手机与电视便捷联动是关键。比如手机上的 QQ 音乐、酷狗音乐等歌单,电视端要么没有对应APP,要么无法同步,听歌很麻烦。我们的黑科技解决了这个问题:手机截图歌单,就能直接投屏到电视播放,实现使用习惯的延续。视频同理,在抖音、快手看到想看的内容,截图或拍照后告诉手机APP“今晚在电视播放”,就能加入待播列表,实现从图片到视频的超级投屏。此外还支持图片、文档投屏及拍照解题,核心是覆盖多场景,延续用户跨设备使用习惯,该功能已在 TV 端落地。

第二个是影视体验加强。一方面,影音搜索实现剧情、台词精准定位,响应速度快;即便没有短视频素材,搜索后也能直接跳转爱优腾芒等 APP 的对应剧集播放。另一方面,从“精准搜片”升级到“我的排片”功能:之前做全网精准搜片时发现,仅满足少数用户需求且难以实现付费转化,而“我的排片”借鉴KTV点歌模式,平衡用户主导与系统辅助。现在用户打开电视满屏智能推荐,缺乏预期和信任感,而“我的排片”让用户能自主添加内容,系统再辅助推荐,加上语音交互的便捷性(一句话就能添加影片并设置周六提醒播放),无需复杂遥控器操作。同时,该功能还解决了旧机升级新机后,用户因UI风格变化找不到功能的问题,让用户感知电视“依然懂我”,目前上线后表现良好。

接下来,我要讲的第二个要点是全网搜索,其核心涵盖两个关键方面。

其一,是“打造什么片都能搜到”的全网搜索能力。其二,则是直接精准定位搜索到短视频片段的深度搜索能力。为何要具备这样的能力呢?原因在于,我们的影片常常会出现上下架的情况,用户既不清楚某个影片存在于哪个 APP 之中,也不了解影片下架的原因。我们期望至少能让用户先搜索到该影片,同时告知用户影片当前的状态,例如是否已下架,以及是否存在关联视频可供观看。如此一来,用户便会觉得在这个平台上,任何影片都能被搜索到,进而对平台产生信任感,愿意来此搜索和观看各类影片。此前,我们内部就出现过一个颇为有趣的现象。就拿我观看《大明王朝 1566》来说,经常是今天能搜到,过两天却又搜不到了。对于不明就里的用户而言,这种信息的缺失会让他们感到十分困惑。对我们来说,关键就在于如何提升用户的信任感。

第三个要点是播放能力。其核心在于,即便在任意的主流 APP 里,我们都能够实现精准的播控。当然,这是借助一些具体方案达成的,鉴于时间关系,我就不在此详细介绍整个播控方案了。

最后一个要点是付费购买。在很长一段时间里,技术领域很少探讨会员如何营销、产品包应该怎样售卖等问题,也鲜少将其付诸实践。目前,由于 KPI 的要求,我们不得不深入探讨这个问题。实际上,我们内部已经开展了一些小范围的实验。后来发现,若将产品包的营销交由大模型负责,会出现一些颇为有趣的现象。我们目前小范围试验的做法是,把产品包的特征和用户的特征都提供给大模型。那么,什么是产品包特征呢?例如在七八九月份,每个月产品包里可能会上线哪些新影片,排片情况怎样,产品包背后内容的特征以及价格特征又是如何的。第二点,把用户的特征也融入进去,比如用户喜欢什么类型的影片,在什么时间段观看影片等。然后把这些信息都交给大模型来决策,大模型会判断何时给用户推荐这个产品包。此外,当用户询问时,大模型能够依据用户的习惯,给出更合适的开通产品包的建议,还能出具一份更为合理的规划。从小范围实践效果来看,整体转化效果较为理想。因为一方面,在我们的电商平台上,用户很容易陷入不知道该购买哪一个产品包的困境。比如同一个少儿内容,影视专区里可能有,少儿专区里也有,用户不清楚该购买哪一个包,以及以什么价格购买,后面内容的特征又是怎样的。现在我们采用一种新的方式处理后,发现付费转化有所提升。目前,付费购买只是我们内部的一个小范围实践,我们只是在尝试在大模型时代,能否运用大模型来进行产品的营销和推荐,这是我们全新的思路。

还有一个要点是在教育场景方面。我们之所以开展教育场景,是因为目前电视的受众群体中,老人和小孩占比较大,教育场景也是我们极为重要的一个场景。为此,我们自主研发了一款学习机平板。其核心功能在于,每日老师布置作业后,家长可以通过手机将老师的微信截图或者作业拍摄下来,作业就能自动传输到我们的平板里。学生在平板里完成作业后,AI 能够完成批改,最后会把批改结果同步反馈给家长,告知家长批改情况。同时,如果这里有相关的课程资源,还能推荐到大屏上,让小朋友到大屏上观看相关的解题视频。以前的解题视频可能只能在手机上观看,现在实际上是将手机、大屏、平板整体联动起来,实现了一种整体的教育解决方案,这是我们在教育场景的实践。

当然,我们还涉及了健康场景。为何要关注健康产业呢?一方面,大健康是一个至关重要的方向;另一方面,我们电视机前的老人比较多。我们并非要取代医院,而是以提升健康指标为目的,全面驱动 AI 健康管理。所以,我们包含了一些功能,如症状情况分析、智能导诊、用药管理和隐私分析等。用户可能会询问某些药能否服用,用手机一拍,我们就能给出解答,比如这个药不能服用,或者某种药适不适合孕妇、小孩服用,我们也能进行深度解读。同时,用户每年体检报告拍照后,能够自动上传,我们会连续分析体检报告,指出健康方面存在的问题,告诉用户每天应该食用什么食物,保持怎样的运动量,或者不需要过度关注某些方面,核心是以健康为目标去驱动用户的生活。此外,还能提供医院挂号等服务,体现了健康场景的闭环。这是目前我们整个健康场景的实践,也是家庭场景中非常重要的一环。

最后一个较大的场景是生活场景。我们核心的想法是,既然想要激活大屏,那么大屏能否实现本地生活服务的闭环呢?比如一句话查指南办事,一句话缴电费,一句话实现上门维修,一句话把家庭所有的琐事都处理妥当,这才是真正实现了资源的整合,有效发挥了大屏的资源优势。一方面,我们能够与本地的生活服务、政务服务相结合;另一方面,也可以与一些文旅项目相结合,这样它才能真正成为家庭的中心。目前,我们在整个生活文旅平台上,已经进行了较多的对接合作,同时也支持本地或者一些生活化服务接口的接入。接入之后,整个平台能够自动具备为用户提供本地生活服务的能力。所以我们认为,本地生活服务是能够逐步改变电视定位的一个核心场景。

从去年的数据可以看出,不管是语音的日活频次、日活率,还是人均使用频次和日活率,都有了明显的提升。

当然,除了数据的提升,现在我们面临的最大问题是,今年分享的课题是日活率、活跃率的提升,明年我希望分享的课题是付费率的提升。因为今年我们面临的课题很简单,就是提升付费率、转化率和营收。

我们刚才讲的这些事情,除了在我们自己的电视上有落地和实践,因为自有用户可以让我们进行最大程度的实践。另外,我们现在还有一些不错的客户案例。 一方面是与南方新媒体进行合作,在南方新媒体的 IPTV 上进行了一些落地,当然这个落地的是我们比较内部的版本,具备 AI 能力。除了南方新媒体,我们在广电行业与东方有线也有合作,目前在东方有线推出了可称为 AI 机顶盒的产品,能够大力促进他们整个机顶盒的营销以及服务的转化。目前这是我们的两个案例。

目前,我们的整个解决方案,一方面在创维的用户上实践成功,成为一款成熟化的方案之后,我们目前落地的场景实际上不只局限于家庭。目前我们在车载场景里,与赛力斯等一些车企进行了落地,同时也包含一些办公和酒店的场景。目前来讲,我们的方案实际上是以智能体为中心,能够跟随用户,在不同空间和场景里持续提供服务的完整解决方案。这个是我今天的分享,谢谢!

来源:流媒体网

相关推荐