摘要:最近 AI 界的大新闻是 GPT-5 和谷歌的世界模型 Genie 3。然而,在无人在意的角落里,微软悄悄把 Edge 进化成了了 AI 浏览器。
最近 AI 界的大新闻是 GPT-5 和谷歌的世界模型 Genie 3。然而,在无人在意的角落里,微软悄悄把 Edge 进化成了了 AI 浏览器。
上一次听到 Edge 的消息还是 IE 正式关停的时候,Edge 作为 IE 的继任者难免会被拿出来讨论,通常没有什么好话。
再上一次是 Edge 加入 sidebar 功能的时候,罕见地抢了一批 Chrome 的用户。
时至今日,Edge 的风评似乎没有比曾经的 IE 好到哪里去。
都 2025 年了,居然还有浏览器的首页充斥着闪烁的 MSN 资讯、天气卡片、股市小窗口,以及永远关不掉的「热门故事」。与此同时,微软不断地在给 Edge 加入「无用的新功能」,让系统变得越来越臃肿。
但如果你愿意再给 Edge 一次机会的话,一键开启 Copilot 模式,Edge 就变成了神似 Dia 的样子:
干净得不像微软出品 。
这个首页就正常多了|图片来源:Edge 浏览器截图
栏目作者召集极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!
现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例: AI 上新|不会用 PS 的我,却敢去小红书上接「设计单」了)向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。
同时,优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。
AGI 太久,只争朝夕,让一部分人先 AI 起来吧!投稿、进群请扫描下方二维码添加极客小助手微信
微软,再造一遍浏览器
要让 Edge 变成 AI 浏览器,除了要更新到最新版本之外,还需要掌握一些小小的「魔法」。然后在设置的「AI 创新」一栏,就可以开启 Copilot 模式。
Copilot 模式的形态介于谷歌在 Chrome 有限 Gemini 集成,和 Manus 这样完全的 AI 浏览器之间。
在 Copilot 模式下,首页就变成了一个对话框,你可以直接用搜索引擎搜索、询问 Copilot 或者让它深度思考。这一点和其他主流的 AI 浏览器差别不大。
Copilot 的第二个入口在地址栏左侧,一颗小药丸形状的图标,单击就可以呼出,或者让它固定在右侧。
Copilot 的第二个入口在地址栏左侧|图片来源:Edge 浏览器截图
官方说它可以「感知所有标签页」。于是我打开了一篇论文、一份财报,以及一个亚马逊相机的搜索页面。随后我告诉 Copilot:「帮我总结特斯拉的财报,还有这篇论文的大纲,以及我想选购一款性价比高的相机。」
一分钟后,Copilot 分别概括了财报和论文,附上了各个价位的最佳相机,并暗示了我给出的需求并不精准 。
这一瞬间,我确实有一种错觉,有另外一颗大脑正在替我工作。
Copilot 同时分析财报和论文,并给出选购建议|图片来源:Edge 浏览器截图
这种总结能力也能迁移到视频上。当你在 Edge 中打开 YouTube 视频时,只要呼出 Copilot 并指示「总结视频」,它就会给出总结。
美中不足的是,Copilot 的这种感知并非全自动的,需要你手动 @ 标签栏,它才能替你工作 。
不过,最能让我产生「幻觉」,是 Copilot Vision。这是一个交互方式上非常新鲜的功能,Copilot 可以直接看到你的屏幕,并以此为基础和你用语音交互,就像你和朋友共享屏幕一样。
Vision 读取屏幕,并给出建议|图片来源:Edge 浏览器截图
例如在一个典型的购物场景,Copilot Vission 就可以直接看到屏幕上的备选产品,并给出选购建议。打开 Copilot Vission,一个带着浓郁广普口音的中年女声就会很热情地和你打招呼:「嗨~我可以看到你屏幕啦!」,很像在 Panda Express 或者 Jade Dragon Restaurant 碰到的那种广东阿姨。
不得不说,现在的 AI 语音已经做得非常自然,已经不太分辨得出 AI 味。碰到 AI 验证的时候,它还会主动安慰你:
「是不是挺烦人的」。
这我还是第一次在 AI 身上感受到了人味,语音交互带来的情感浓度的确要比文字强很多 。
但是就功能性来说,Vission 还算不上实用。一方面是它的图像识别速度跟不上我的浏览速度。另一方面,它在图像和语音识别的准确率上也有待提升。例如它会把「IPX6」识别成「IPX4」,我用语音纠正了它,它马上道歉,但是听成了「IPX7」。
目前的 Vision 有一点像家里的女性长辈,不懂科技,聊天信息密度不高,但是非常包容,情绪价值拉满 。
以上就是 Edge 最主要的功能了。还有一些功能微软表示正在开发中,例如 Agent 能力、智能标签分组或者是动态的 AI 助手。
实际上,很多功能微软已经开发完毕、处于测试阶段了,出于大公司的保守,它没有集成到 Edge 中。但是没有关系,进入单独 Copilot 主页,打开「实验室」,你可以看到,微软确实在开发一些好玩的东西。
Copilot 实验室|图片来源:Edge 浏览器截图
Copilot 3D,可以一键将图像转换为 3D 模型。上传自己的照片,你就可以轻松得到一个「逼真」的 3D 头像。做得很好,下次别做了|图片来源:Edge 浏览器截图
Copilot 游戏,体验原汁原味的上古 FPS 大作《雷神之锤 2》,并且每一帧都是由 AI 实时生成的,同时画面非常卡顿。AI 生成游戏的《雷神之锤 2》|图片来源:Edge 浏览器截图
Copilot Actions 是微软最接近「Agent」野心的功能。我试着让它预订了一张 8 月 10 号从上海飞北京的机票。Copilot 大概跑了 20 分钟,完成了点点鼠标一分钟就能做完的工作。
但奇妙之处在于: 它允许我随时「抢方向盘」。
当它差点给我选了个中转航班时,我可以随时接管浏览器权限,把航线拉回直飞。这种「人机共驾」的体验,比那些一路黑箱跑到底的竞品要安心得多。
实际上,这样操作之后,跑任务的效率会大大提升,最终的出品也可控得多。我觉得这才是目前 Agent 最实用、最可靠的人机协作形态。正如它的名字 Copilot 一样,这是一种副驾驶员的哲学。
用户可以随时暂停,接管浏览器 | 图片来源:Edge 浏览器截图
02微软的历史包袱
总的来说,Edge 浏览器的 AI 进化给到了不错的体验,基础功能不逊色于主流工具的同时,也有一些自身的亮点,例如标签感知和 Vision。
但与此同时,这还不是一款可以成熟到覆盖所有 Edge 用户的产品。很多宣传的功能并没有完全兑现,各个功能的入口也分散在四处。最明显的就是,地址栏旁 Copilot 入口支持附件上传和语音交互,而主入口的 Copilot 反而不支持这些功能。
更大的割裂感在于 Edge 浏览器本身和 Copilot 模式上。
单就视觉而言,传统功能区延续了 Win11 的 Fluent 圆角玻璃;AI 面板则是现代极简的风格,仿佛两代人共用一张办公桌。
两种设计风格同时共存在一个页面
更重要的功能性上,Edge 团队背负着沉重的历史包袱:兼容模式、IE 模式、企业策略、臃肿的 PDF 阅读器……而 Copilot 团队显然想再造一个「AI 优先」的物种。两股力量在同一具身体里拉扯,导致入口分散、菜单嵌套、选项重名。
于是,Edge 就像是一座仍在施工的跨河大桥:桥这头,是微软多年堆出来的旧公路,坑洼却熟悉;桥那头,是闪着霓虹的 AI 新大陆,诱人却断续。
用户站在桥中间,有一些迷茫。
来源:极客公园