AI 视频生成王者 Sora 上线:OpenAI 的“魔法棒”,1080P 20 秒具象化你的想象力|懂点AI

B站影视 2024-12-10 20:40 2

摘要:掌握AIGC脉动,把握科技脉搏。动点科技每天收集汇总全球AIGC进展与热点,每天5分钟带您了解AIGC,希望与您共同玩转 AIGC,解码行业发展新风向,开启智慧新时代!

掌握AIGC脉动,把握科技脉搏。动点科技每天收集汇总全球AIGC进展与热点,每天5分钟带您了解AIGC,希望与您共同玩转 AIGC,解码行业发展新风向,开启智慧新时代!

文 |动点科技

排版|恩惠

本文预计阅读时长5分钟

01 AI 视频生成王者 Sora 上线:OpenAI 的“魔法棒”,1080P@20 秒具象化你的想象力

OpenAI 公司 12 月 9 日发布博文,宣布正式推出 Sora 文生视频 AI 模型,邀请 ChatGPT Plus 和 ChatGPT Pro 用户,通过访问 sora.com 网站,生成最高分辨率 1080p、时长达 20 秒的视频,并支持宽屏、竖屏和方形比例。OpenAI 公司表示用户可以生成分辨率高达 1080p、时长不超过 20 秒的视频,并支持宽屏、竖屏或方形比,所有 Sora 生成的视频都带有 C2PA 元数据,便于识别以及后续验证来源。

ChatGPT Plus 每月可以免费生成 50 个 480P 分辨率的视频,如果选择更高的 720P 分辨率,则会占用更多的每月免费生成视频额度,但官方新闻稿中并未公布更多细节。

ChatGPT Pro 用户(月费 200 美元)包含 10 倍的使用量、更高的分辨率以及更长的持续时间,OpenAI 正在为不同类型的用户制定定制价格,并计划于明年初推出。

用户可以自带素材进行扩展、混剪和融合,或者根据文本生成全新内容,OpenAI 开发了全新的交互界面,用户可以通过文本、图像和视频提示 Sora 生成内容,故事板(storyboard)工具则允许用户精确控制每一帧的输入。

02 Reddit 推出 AI 站内搜索工具 Answers

Reddit 12 月 9 日发布公告,宣布推出 AI 驱动搜索工具 Reddit Answers,目的是进一步提升平台信息检索效率。Reddit Answers 类似于主流 AI 搜索引擎,以优雅的格式、丰富的内容、极高的可读性,来回答用户的提问,并会附上相关的来源链接。不过该功能的独特之处在于,这些信息没有借助谷歌等搜索引擎,而是直接来源于 Reddit,目前已向美国地区的网页版和 iOS 版 Reddit 用户开放,后续将扩展至安卓版,以及更多国家和地区。Reddit Answers 提供一系列预设搜索建议,例如“一直以来最喜欢的任天堂角色”、“2025 年最佳推理小说”和“第一次带婴儿乘飞机的技巧”,方便用户快速查找热门话题。

03 曼城邀请球迷用 AI 设计球衣,获胜作品将用于 2026-2027 赛季

曼城足球俱乐部宣布将举办一场 AI 设计球衣大赛,邀请球迷利用人工智能技术设计俱乐部 2026-2027 赛季的第三套球衣。这套球衣不仅将在赛场上亮相,还将面向球迷发售。曼城与运动品牌彪马合作,推出了一个基于 DeepObjects 人工智能技术的文字转图像球衣生成器“Puma AI Creator”,球迷可以通过创建账户并输入描述球衣外观的提示词来使用该工具。随后,球迷可以从“抽象”“情感笔触”“梦幻视觉”等多种风格中选择一种,AI 将根据所选风格生成四种不同的设计选项,并允许球迷自定义衣领、装饰颜色和徽章。曼城表示,球队门将埃德森、斯特凡・奥尔特加和里科・刘易斯率先使用了彪马 AI 生成器,以“足球球网”为灵感设计了一套门将球衣。

04 海螺AI海外版带来AI语音克隆功能,可以复制你的声音

做视频的时候,往往会碰到配音的问题。海螺AI海外版给用户带来新的应用方式,那就是复制你的声音,目前支持英语,日语和中文。系统最多支持12种语言,用户可选择不同情绪风格,丰富真实的语音表现。操作方式也比较简单,只需10到60秒的音频样本,便能完美复刻用户的声音。这个应用模式后续如果大模型继续完善的话,应该能带来不少使用场景,当然未来也要注意可能的监管和隐私问题,不过至少是AI的一种创作模式,会带来不少创新。

05 X旗下Grok 助手带来名为Aurora的AI图像生成器

马斯克一直在 AI 产品上探索。这次,X 的Grok 助手中推出了一款新的图像生成器 ——Aurora。Aurora 的设计初衷是为了用AI创造照片般真实的图像。在移动应用和网页的 Grok 标签中,用户可以访问 Aurora 进行图像生成。与 X 在十月份推出的首款图像生成器类似,Aurora 的使用没有过多的限制,包括一些可能涉及版权的图片生成。Aurora 的发布正值 X 将 Grok 功能对所有用户免费开放之际,当然目前的生成效果还有一些瑕疵,比如对于一些细节的刻画,未来应该还会继续优化,同时生成的次数有所限制,在大模型后期优化之后要看官方如何运营。

06 涉嫌违反反垄断法,英伟达被立案调查

近日,因英伟达公司涉嫌违反《中华人民共和国反垄断法》及《市场监管总局关于附加限制性条件批准英伟达公司收购迈络思科技有限公司股权案反垄断审查决定的公告》(市场监管总局公告〔2020〕第16号),市场监管总局依法对英伟达公司开展立案调查。

根据《反垄断法》第58条的规定,若企业在收购过程中违反承诺,且行为具有排除、限制竞争效果,可能会面临上一年度销售额10%以内的罚款。

而根据《反垄断法》第63条规定,违反本法规定,情节特别严重、影响特别恶劣、造成特别严重后果的,国务院反垄断执法机构可以在本法第五十六条、第五十七条、第五十八条、第六十二条规定的罚款数额的二倍以上五倍以下确定具体罚款数额。

07 短期内难实现,苹果对开发通用 AI 不感兴趣

通用人工智能(AGI)是许多人工智能公司经常讨论的话题,但苹果似乎与大多数公司有着截然不同的观点。苹果机器学习和人工智能战略高级副总裁约翰·詹南德雷亚(John Giannandrea)在接受《连线》采访时表示,苹果对通用人工智能(AGI)并不感兴趣,这一目标不现实且有些轻率。

詹南德雷亚认为,与许多竞争对手不同,苹果对开发通用人工智能不感兴趣,这种追求在公司看来是不现实的,几乎是轻率的。“该领域最可信的研究人员认为,还有许多未解决的问题和突破需要实现,”詹南德雷亚说,“认为你可以通过扩大这些技术以实现 AGI 的想法非常天真。”

詹南德雷亚说,苹果很可能参与重要的突破,但不是为了启动奇点,而是为了改进其产品,“我们从事我们所谓‘调查研究’的工程师可能比从事明年即将推出的产品工作的工程师还要多”。他指的是公司的基础研究。

换句话说,詹南德雷亚并没有排除苹果参与 AGI 相关突破的可能性,但其最终目标不是 AGI,而是面向用户的产品,以改善人们的生活。苹果的 AI 负责人认为,一些常见的 AGI 乐观情绪是“非常天真的”。

- - - - - - - - END - - - - - - - -

精彩好文值得推荐!

一键转发,戳个在看!

来源:动点科技一点号

相关推荐