摘要:在 ChatGPT 霸榜 App Store 免费榜单 20 个月之后, 9 月一款来自 Google 的 AI 应用Gemini,凭借图像生成功能 Nano Banana 成功登顶,打破了 OpenAI 长期以来的统治局面。
在 ChatGPT 霸榜 App Store 免费榜单 20 个月之后, 9 月一款来自 Google 的 AI 应用Gemini,凭借图像生成功能 Nano Banana 成功登顶,打破了 OpenAI 长期以来的统治局面。
Gemini 只是冰山一角,从 NotebookLM 到 Flow、从 Gemini CLI 到 AI Mode,Google 已构建了一整套 AI 工具矩阵,覆盖写作、搜索、视频、开发等多个场景。
Google 也不只是在追赶 ChatGPT,它在试图以“工具型 AI 生态”取代“聊天型助手”的主导地位。
但这个“全家桶”真的更胜一筹吗?
这次引爆 Gemini 下载量的,是一个名为 Nano Banana 的图像生成功能。
用户通过简单提示词就能生成高度真实的图像,进行可视化编辑。
在社交平台和短视频平台带动下,Nano Banana 很快成为热门功能。
但如果 Gemini 只有图像生成功能,恐怕难以撼动 ChatGPT 的地位。
Gemini 背后,是整合了 Canvas、Deep Research、NotebookLM、Veo、AI Mode、Gemini CLI 等多个模块的工具生态,这些工具彼此之间围绕 Gemini 核心模型协同运行。
今年,Gemini 2.5 Pro 和 Flash 版本已经全面上线。
Pro 强调推理能力,Flash 主打响应速度,两者之间可自动切换,用户无须手动选择模型。
这种模型路由机制的优化,解决了 ChatGPT 用户经常遇到的“模型选择不明确”问题。
ChatGPT 在语言生成方面的表现依然稳固,尤其是 GPT-4 和 GPT-4o 的更新,使其在逻辑表达、摘要能力、对话上下文延续性方面维持领先。
但用户对 AI 的使用需求已从“仅仅聊天”转向“完成任务”。
以 Google 的 NotebookLM 为例,它支持上传多达300个文档,且自动生成六种形式的总结内容,包括文字报告、播客预览、视频介绍、思维导图、闪卡和小测验。
这些功能远远超出了传统语言模型的应用边界,更接近于一个深度知识管理系统。
再看 Gemini CLI,它是一个本地运行的命令行工具,不仅能处理文本,还可以下载视频、转码音频、压缩图像、批量重命名文件。
它调用了如 yt-dlp 和 FFmpeg 等专业工具,把 AI 与开发、内容处理、自动化任务结合在一起,提升了使用效率和操作自由度。
ChatGPT 在这类应用上的布局并不明显。
有人担心 Google 的 AI 工具线太“多而杂”,但从架构设计来看,这些工具是围绕 Gemini 模型构建的“模块化系统”。
用户可以在 Gemini 应用内直接跳转至 Canvas 设计画布,或调用 NotebookLM 进行文档总结,也可以在 Flow 中生成短视频。
Flow 是 Google 推出的 AI 视频工具,支持竖屏 9:16 格式,分辨率最高可达 1080p,对接 TikTok、YouTube Shorts 等平台的内容创作者需求非常精准。
在2025年最新更新中,它的视频生成单价已降至 0.15 美元每秒,远低于 Sora、Runway 等主流竞品。
这种模块化部署方式,兼顾了功能专业化与生态协同。
用户不必频繁跳转应用,也不必学习多个平台的操作逻辑,在 Gemini 主平台中即可完成多任务协作。
Gemini 的另一个优势,在于它与 Google 原生生态系统的深度绑定。
无论是与 Gmail、Google Docs、Drive 的集成,还是在搜索领域的 AI Mode 功能,Google 正在将 AI 从单独的聊天助手,变成一个嵌入式的操作层。
AI Mode 是 Google 搜索的新形态,它不同于传统的 AI Overview 摘要,而是结合 Gemini 模型提供推理能力更强的搜索结果。
目前支持英文、葡萄牙语、日语、韩语等语言,未来有望覆盖更多语种。
Gemini 登顶 App Store 免费榜的意义,不止在于一次排行榜的更替。
它代表着一种 AI 使用方式的转向,从“会说话”到“能干活”,从“单点能力”到“系统任务”。
ChatGPT 打开了大众使用 AI 的大门,但 Gemini 提供了一个更完整的答案。
Gemini 的登顶,是一个阶段的结束,也可能是另一个阶段的开始。
来源:晓婷医生吖