国产AI视频Vidu发布新版:攻克一致性难题丨搜狗输入法集成AI搜索

B站影视 2024-11-22 09:49 6

摘要:近日,北京生数科技旗下的文生视频大模型 Vidu 发布了 1.5 新版本,可实现“世界领先水平”的突破 —— 能够理解多样化素材的同时输入,突破人物和对象在连贯视频内保持一致性的世界难题。

AI奇点网丨AI资讯丨提供1500+款AI效率工具

搜索【华军AI产品榜】发现最受欢迎的先进工具

近日,北京生数科技旗下的文生视频大模型 Vidu 发布了 1.5 新版本,可实现“世界领先水平”的突破 —— 能够理解多样化素材的同时输入,突破人物和对象在连贯视频内保持一致性的世界难题。

Vidu 方面表示,其在上线之初就已具备角色一致性生成能力,通过锁定人物面部特征可解决视频生成的关键痛点,确保了人物面部特征的一致性。

比如下面这个示例,将两个主体对象输入视频生成模型,在提示词的帮助下,就可以快捷实现梅西庆祝进球的画面,转换为马斯克的脸庞。

此次发布的更新中,Vidu 则首次展现了大模型对于 Tokens 上下文学习的能力,提升了整体视频模型的可控性,通过灵活的多元输入实现了多角度、多主体、多元素的一致性生成。

Vidu 1.5版本拥有以下技术突破成果:

复杂主体的精准控制:无论是细节丰富的角色,还是复杂的物体,Vidu 都能保证其在多个不同视角下的一致性。如造型复杂的 3D 动画风格角色,无论视角如何变化,其能够始终确保头型、服饰的全角度细节一致,避免了传统视频模型在复杂视角切换时产生的瑕疵。

人物面部特征和动态表情的自然一致:在人物特写镜头中,其能够自然且流畅地保持人物面部特征和表情的连贯性,避免了面部僵硬或失真的现象。

多主体一致性:用户可上传多个主题图像,包括人物角色、道具物体、环境背景等,并在视频生成中实现这些元素的交互。例如,用户可以上传主体、客体和环境的图片,创建定制角色身穿特定服装、在定制空间内自由动作的场景。

11月22日,腾讯旗下的搜狗输入法发布全面升级,发布V12版本,推出了 AI 搜索和 AI 快查功能,让用户在使用输入法进行聊天或者写作时能够直接进行快捷的 AI 搜索任务。

搜狗输入法本次升级基于“腾讯混元”大模型进行开发,官方号称「输入即搜索」,使页面上所有的文本输入框变身为“搜索框”,无论是学习、办公还是社交场景,用户都可以实现边聊边搜、边写边搜的全新交互体验。

本次更新的主要内容如下:

AI 搜索:输入框即搜索框,依托腾讯混元大模型,点击放大镜“秒出答案”。

AI 搜索 PC 端:轻敲“等号”快出结果,划词选中,开启 AI 能力。

AI 快查:查天气、股价、假期... 秒出结果,聊天不中断。

AI 陪伴:桌面宠物支持亲昵互动,数十款可选。

魔术手势:上下左右轻松滑,删除恢复更流畅,单手 / 分离 / 悬浮键盘,大屏 / 折叠屏自如适配输入。

全新视觉:视觉轻盈更清新,简洁品质感,22 个键盘布局,更多选择。

11 月 21 日,努比亚发布今年的旗舰手机努比亚 Z70 Ultra,在保持了努比亚红色点缀的家族设计语言外,还配备了最新的旗舰高通骁龙处理器,以及超过了 95% 的超高屏占比全面屏。

新机搭载了骁龙 8 至尊版芯片,采用 LPDDR5X+UFS4.0 的内存组合,配备了 6.85 英寸的 AMOLED 全面屏,屏占比高达 95.3%,同时内置了第七代屏下摄像技术,显著提升了自拍体验。

相机传感器方面,努比亚 Z70 Ultra 搭载了 35mm 人眼仿生动态镜头和超微距潜望长焦镜头,配备了行业唯一的单反级机械快门。此外它还拥有业界唯一的两段式游戏实体键,配备 6150mAh 的大容量电池和 80W 快充。

努比亚还与中国电信合作,在 Z70 Ultra 手机搭载由中国电信打造的全新星辰大模型,包括 30 亿参数端侧大模型 + 千亿参数的云侧大模型,组成了自然语言、语音、影像、视觉、性能、多模态等多个大模型矩阵。号称是“首个全语音全场景穿透式 AI 操作系统”。

星云 AIOS 系统在大模型的帮助下,可实现全语音全场景的交互,包括智能订票、股票盯盘等,还具备 AI 翻译、文档处理能力。

外观上新机提供了黑玺、香珀、星空典藏版三种配色,其中星空典藏版支持实时语音双向卫星通话。目前新机开始预售,11 月 25 日全渠道上市,定价为 4599 元起,星空典藏版则为 5499 元起。

11 月 21 日晚间,百度公司发布 2024 年第三季度财务报告,显示季度总营收 336 亿元,核心业务营收 265 亿元,归属净利润为 75.4 亿元,同比增长 17%,超出市场预期。

财报显示,截至今年 11 月,文心大模型日均调用量达 15 亿次,对比去年 Q4 披露的日均调用量 5000 万次,在不到一年时间内增长了 30 倍。

在第三季度财报电话会上,百度 CEO 李彦宏透露,百度将于 2025 年初发布文心大模型的新版本,以巩固其在基础大模型市场份额上的领先优势。

当地时间11月21日消息,据外媒报道,马斯克旗下的人工智能创业公司xAI已完成新一轮融资,共筹集到 50 亿美元新资金,融资规模已经达到了 500 亿美元,与目前行业领头羊 OpenAI 处于同一梯队。

据报道,Valor Equity Partners、红杉资本和安德森-霍洛维茨参与了此次融资,另外中东国家卡塔尔的主权财富基金也参与了此次融资。

今年 5 月,该公司曾经宣布,这些投资方第一轮支持了60亿美元的资金。

来源:AI奇点网一点号

相关推荐