速来围观!大模型产品demo还能这么玩~

B站影视 日本电影 2025-05-29 20:31 2

摘要:在昨天上午举行的百度智能云Demo Day上,众多好玩又实用的大模型产品Demo重磅亮相,首次揭开神秘面纱。活动现场围绕“所见即所得”的体验理念,带来了“秒哒”和“视频云”两款产品的实时演示,借助多个用户高度关注的真实场景,通过Demo形式生动复现,直观展现了

零基础的代码小白也能做游戏了?

几分钟生成的电商网站还带智能客服?

公司发的玩偶小熊竟然能变身会聊天会解题的玩伴?

手机随手一拍,随时随地都有专家答疑解惑了……

在昨天上午举行的百度智能云Demo Day上,众多好玩又实用的大模型产品Demo重磅亮相,首次揭开神秘面纱。活动现场围绕“所见即所得”的体验理念,带来了“秒哒”和“视频云”两款产品的实时演示,借助多个用户高度关注的真实场景,通过Demo形式生动复现,直观展现了百度智能云大模型产品的应用价值与落地能力。

秒哒功能上新!如何一键让你的网站开口说话?

大模型时代的「无代码」正加速落地。作为百度旗下的 “无代码应用搭建平台”,「秒哒」让任何人都能通过一句话把创意变成能上线的交互式应用——从小游戏、小工具、轻应用、营销页面、网站到企业系统。此次直播中,秒哒团队发布了能让 “网页开口说话” 的千帆智能体接入能力,并用 “边聊边搭” 的方式,完整展示了AI开发的速度与魔力。

秒哒四大关键特性:

>>智能体协作矩阵流——产品、架构、开发、测试等多智能体协作,效率提升百倍

>>多工具调用——云能力、第三方工具、智能体等等,一句话调取,即插即用

>>LGUI双模交互,智能和易用兼备——说出来、拖出来都行,小白和专业人士都顺手

>>自演进智能体,无限进化——每次交互都是训练数据,应用越用越懂业务

百度秒哒产品负责人朱广翔与产品经理张旭明在直播中接力演示,通过多个高能demo,把「人人都是开发者」的未来直接搬到观众眼前。

1. 玩游戏?写规则?你只管说,秒哒来造!

>>「包粽子小游戏」生成体验,美术素材与交互逻辑统统搞定

>>即时试玩、边玩边改规则,满足节日活动与品牌营销的快速创意需求

>>支持分享裂变等常用运营组件,轻松启用

2. 人人都是开发者,创意皆可落地

>>现场一句话生成「端午节知识问卷」,自动构建前后台

>>对话加拖拽修改内容、布局、组件,所见即所得

>>提交后秒看统计,完整复刻传统研发从需求到上线的流程

3. 上传PRD,一键生成大型官网

>>将标准PRD文档拖入秒哒,AI自动解析需求、拆解功能

>>快速生成站点结构、导航、页面&组件布局

>>按需对话微调文案与视觉,复杂项目也能「无需沟通、自动交付」

创意来了,秒哒一下!

正如朱广翔总结的:“一个人发号施令,一群AI员工埋头干活;在秒哒,人人都能体验‘当老板’的感觉。”从问卷到小游戏、从PRD生成网站到接入客服智能体,秒哒用demo案例证明:只要你有创意,只要你说得清楚,就能打造真正的AI App=UI(好看的皮肤)+Agent(聪明的大脑)——剩下的交给秒哒,应用立等可取。

如何1天内让硬件变成“双商在线”的互动搭子?

大模型的到来,让人机交互方式正式进入了LUI的时代,用户可直接通过语音、视频、图片、文字、手势等多种模态与大模型进行交互。那现在的LUI交互方式,也可以分为三种:一种是打字或者上传文件 进行交互;第二种是按住说话,然后发送等待回复;那第三种方式就是在线实时的互动,类似语音通话、视频通话的方式,与家人朋友实时沟通的方式一样,这种方式是最接近真人与真人面对面的沟通形态,会更加丝滑更加自然。

此次直播中,视频云团队全新发布百度智能云多模态实时互动方案,支持语音互动、视觉互动、数字人互动、复杂任务互动四种交互形态,并具备以下特性:

>>基于3A处理、VAD处理等优化技术,确保语音识别的准确性和低延时。从说话停止到听到大模型回复的首token延时仅为1.3s,可以实时打断插话,并且打断延时仅为800ms,处于行业领先水平。

>>可以直接调用内置互动模型服务,快速上线业务,内置模型也允许定制,例如定制人设、定制指令、定制话题等。方案也可以直接使用第三方模型或智能体,保持最大灵活性,同时也支持智能打断、语音双工、低延迟互动等能力。

百度智能云视频云高级产品经理尤莉、技术架构师柯于刚在直播中演示了语音交互、视觉交互和数字人交互三种交互场景demo,让普通的玩偶小熊、手机、数字人都变成我们身边“双商在线”的互动搭子~

1. 语音交互

语音交互方面,通过采集和播放音频,并且与海量的百度分布式云服务连接,保证低延迟、实时交互:

1、高质量全链路语音处理:设备采集声音后,经端侧3A技术初步优化,实时传输至云端进行二次深度处理,再经大模型与智能体分析生成答案,实现声音采集到智能应答的全流程闭环。

2、高拟人化语音克隆:在语音克隆阶段,云端提供高效服务,用户仅需数分钟即可完成个性化声音克隆,支持不同交互场景下的角色声音定制。

3、多模型交互体系:为确保每次交互的高质量输出,采用多模型、多智能体架构,依据用户提问意图动态匹配最优处理方案。

2. 视觉交互

视觉交互方面: 可支持摄像头将流发送至云端进行图像、文件、视频流理解,并支持云端将文本、图像、文档、视频流等视频流发送至设备显示。

3. 数字人交互

数字人交互方面:可支持用户添加专属数字人形象,与语音、视觉交互技术相结合,秒变身为各类行业专家。

4. 任务交互

此外,在任务交互方面,Q3季度还即将推出复杂任务处理框架,支持执行高复杂度、长耗时的任务场景。该框架具备周期性任务调度能力,支持按日/自定义周期触发重复性任务流程,满足用户自动化任务管理需求。

多模态实时互动方案在智能硬件方向应用广泛,百度智能云会持续做好多模态互动底座的建设和支撑,去协同和赋能不同垂类行业的模组及解决方案伙伴进行产品方案整合,从而去更好的服务终端客户,带来极致的体验和性价比。此外,也会引入更多的内容资源方、IP方,以及翻译、导航、天气等丰富的组件,让生态更加繁荣,更好的串联上下游资源,与伙伴一起打造增长引擎,一起推进AI交互的落地和发展。

来源:百度智能云官方

相关推荐