GPT-4o登顶,但AI吉卜力被宫崎骏认为是侮辱

B站影视 电影资讯 2025-04-01 17:54 1

摘要:2025年4月1日凌晨,OpenAI再次以技术革新震撼全球——GPT-4o原生图像生成功能的全面升级,不仅以压倒性优势冲进大模型排行榜第二,更以吉卜力风格的创作狂潮席卷社交网络,彻底颠覆了AI图像生成的竞争格局。

北京时间今日凌晨,OpenAI以一场静默的“技术核爆”震撼全球科技圈——全新升级的GPT-4o正式登场!

《电脑报》青少年月刊有奖调查

你是不是也对AI的酷炫功能充满好奇?想用代码召唤属于自己的机器人?只需花3分钟完成这份问卷,即有机会获得《电脑报》及新刊物订阅、未来人类32GB定制U盘等丰富奖品!点击了解详情!!

01

GPT-4o引爆图像生成革命

2025年4月1日凌晨,OpenAI再次以技术革新震撼全球——GPT-4o原生图像生成功能的全面升级,不仅以压倒性优势冲进大模型排行榜第二,更以吉卜力风格的创作狂潮席卷社交网络,彻底颠覆了AI图像生成的竞争格局。

GPT-4o的杀手锏在于其自回归(Autoregressive)架构,与传统扩散模型(如Midjourney)不同,该模型通过“对话式”交互实现精准控制。用户不仅能上传图片进行风格转换,还能通过自然语言指令实时修改细节——例如为猫咪戴上侦探帽,或为科幻场景添加血条UI。这种“模型即产品”的设计,让创作门槛从“参数调试”降为“聊天对话”,效率提升数十倍。

此次更新中,GPT-4o最核心的升级在于多模态交互能力的质变。用户可通过自然语言连续调整图像风格与构图,例如在对话中要求“将画面光影调暗,并添加一只戴帽子的猫”,系统能精准执行且保持视觉一致性。

此外,模型大幅优化了文字渲染能力,生成的标志、图表等信息图像中,文字准确率远超同类工具,甚至能结合上下文知识库实现“零提示词创作”。

技术报告显示,GPT-4o在LMSYS基准测试中跃居全球第二,数学、编码、复杂问题解决等关键领域评分飙升30分以上,直接超越自家GPT-4.5和竞争对手Grok 3。更惊人的是,其成本仅为GPT-4.5的十分之一,API响应速度提升两倍。

在最新发布的AI大模型综合能力榜中,GPT-4o以87.6分(满分100)的成绩紧随榜首Claude 3 Opus,但相较第三名Grok-3的79.1分已拉开断层差距。

Grok-3的致命短板暴露于多模态场景的笨拙:其图像处理依赖独立模块拼接,导致跨领域任务频频“卡壳”。

而GPT-4.5虽在文本逻辑上保持优势,却因未针对图像原生优化,在短视频生成、虚拟现实等新兴赛道被用户诟病“慢半拍”。

02

吉卜力美学与全网狂欢

“ All Ghibli Images(AGI) ”——这一网友戏称的标签,精准概括了GPT-4o引发的现象级传播。

用户仅需输入“吉卜力风格”,即可一键生成宫崎骏动画般的场景,从网红表情包到经典名场面,甚至个人生活照均被“二次元化”。OpenAI CEO山姆·奥特曼连夜更换吉卜力风格头像,并坦言GPU因生图需求暴增而超负荷运转。

Midjourney等传统工具在此次浪潮中黯然失色。用户实测对比显示,GPT-4o在光影细节、角色一致性上表现更优,且支持多轮修改指令,例如“让角色穿上雨衣,背景改为雪景”。设计师群体亦感叹:“AI已能捕捉吉卜力的灵魂——治愈感与奇幻氛围的平衡。”

上线仅12小时,GPT-4o的API调用量已突破2.3亿次,社交媒体相关话题阅读量超50亿。其流量爆发的背后,是三大群体的狂欢——

1.内容创作者:短视频博主利用其“文字→分镜→成片”的全链路生成能力,将内容生产效率提升10倍;

2.电商企业:通过AI实时生成百万级个性化商品图,广告点击率平均提升22%;

3.科研机构:在蛋白质结构预测、天文图像分析等领域,GPT-4o展现出超越专业软件的潜力。

03

AI吉卜力为何不被宫崎骏认可

“这是对生命本身的侮辱。” 宫崎骏对AI的态度从未动摇。

早在2016年,他在纪录片中看到AI生成的动画片段时,便直言感到“生理性厌恶”。他认为,手绘动画的每一笔触都承载着创作者对生命的敬畏与情感的投入,而AI生成的“完美模仿”剥离了人性的温度,沦为空洞的技术复制。

宫崎骏的坚持,源于手绘动画的不可替代性。吉卜力作品通常需数年打磨,如《风之谷》的每一帧都凝聚着团队对细节的极致追求。而AI生成一张“吉卜力风”图片仅需1分钟,成本几乎为零。这种效率对比折射出艺术与技术的根本矛盾:AI能模仿风格,却无法复刻故事中的哲思与人性共鸣。正如网友所言:“《千与千寻》的魔法,在于它教会我们看见被忽视的美,而非滤镜般的画面转换。”

值得一提的是AI生成的吉卜力风格图片是否侵权?这一问题引发激烈争论。

法律专家指出,“创作风格”本身不受版权法保护,但OpenAI若未经授权使用吉卜力电影画面训练模型,则可能触碰法律红线。

尽管宫崎骏的批判态度人尽皆知,吉卜力工作室母公司日本电视台至今未公开回应,这一沉默被解读为对技术趋势的无奈。更具讽刺意味的是,连宫崎骏批评AI的纪录片片段,也被网友二次加工成“吉卜力风”表情包。

04

争议与未来

尽管GPT-4o引发创作狂欢,争议也随之而来。宫崎骏公开批评AI生成“缺乏对生命的敬畏”,版权问题与职业冲击的讨论再度升温。技术层面,模型仍存在图像裁剪偏差、编辑一致性不足等局限,OpenAI表示将进一步优化多模态对齐能力。

Midjourney CEO公开质疑GPT-4o“只为融资炒作”,却难掩焦虑。

曾以美学性著称的Midjourney,在4o的多模态理解能力前黯然失色。设计师章萧醇感叹:“两年研究的工具链,一夜成了摆设。”GPT-4o不仅能处理20个对象并保持逻辑关联(远超同行5-8个),还能调用知识库生成专业图表,教育、游戏、广告等场景的创意工作正经历“AI平权”。

行业分析师指出,此次更新标志着自然语言交互正式成为AI图像生成的核心入口。随着API接口开放,GPT-4o或将重塑广告设计、影视概念创作等领域的生产流程。面对谷歌Gemini等对手的追赶,OpenAI能否凭借“低成本+高可控性”持续领跑,仍待观察。

05

OpenAI的“阳谋”

GPT-4o的横空出世,绝非一次简单的技术升级,而是OpenAI精心布局生态帝国的一枚关键落子。从ChatGPT企业版到Sora视频模型,再到如今的GPT-4o,这家公司正以惊人的速度编织一张覆盖文字、图像、视频的全模态生产网络。

这条技术链的终点,是一个完全由AI驱动的创作生态闭环——用户只需输入需求,便能获得从文案策划、视觉设计到动态呈现的一站式解决方案。

这种全链条能力对中小企业的吸引力不言而喻。过去,企业若想实现AI多模态内容生产,往往需要分别采购文本生成、图像处理、视频剪辑等多套工具,不仅成本高昂,数据孤岛问题更是难以解决。

而OpenAI通过统一的技术架构,将复杂流程简化为“自然语言指令→多模态输出”的直通车。这背后的商业逻辑清晰而锋利:以极低的使用门槛吸引海量用户涌入,再通过订阅制服务将流量转化为持续收入。

与此同时,GPT-4o的爆发式应用正在为OpenAI构建更坚固的技术护城河。数以亿计的用户每天生成的海量图像数据,如同永不枯竭的燃料,持续注入模型训练的飞轮。

这些真实场景中的交互反馈,让系统能够捕捉到传统实验室数据难以覆盖的长尾需求——从网红博主的“光影氛围感”到工程师的“零件尺寸公差”,GPT-4o的进化速度正在突破人工标注的极限。这种“越用越强”的滚雪球效应,使得竞争对手即便投入同等算力,也难以复现其生态滋养出的理解深度。

06

点评人类与AI的创造力共生

GPT-4o的爆发,是AI从“工具”进化为“创作伙伴”的分水岭。它或许会重塑设计行业生态,但人类独有的情感与叙事能力,仍是AI难以跨越的护城河。正如网友用4o生成的《千与千寻》高清版——技术可以复刻画面,但汤婆婆眼神中的贪婪,仍需观众自己体会。

微信订阅欢迎通过邮局渠道订阅2025年《电脑报》邮发代号:77-19单价:8元,年价:400元主编|黎坤总编辑|吴新壹零社:用图文、视频记录科技互联网新鲜事、电商生活、云计算、ICT领域、消费电子,商业故事。《中国知网》每周全文收录;中国科技报刊100强;2021年微博百万粉丝俱乐部成员;2022年抖音优质科技内容创作者”

来源:伊藤诚一郎

相关推荐