摘要:字节跳动旗下 AI 助手豆包日前上线了图片理解功能,在电脑端或 App 端上传图片后即可识别图片内容。
文 |动点科技
作者|Steven Lee
排版|恩惠
本文预计阅读时长4分钟
字节跳动旗下 AI 助手豆包日前上线了图片理解功能,在电脑端或 App 端上传图片后即可识别图片内容。
据了解,豆包的“图片理解”功能可识别图片中包含的元素和基本特征。用户还可通过该功能询问某景点所处的位置或某个角色出自哪部影视作品。好奇这个功能具体表现如何,那就继续往下看。
推荐:豆包 App 试用:几近全能的 AI 助理
AI理解图片
我们尝试让豆包识别玻璃瓶可口可乐、一张风景照和两张影视作品剧照,结果如下:
在 PC 端上传图片后,对话框内会自动显示“解释这张图片”快捷按钮。可口可乐照片、风景照的解读令人满意。
“牛魔王”识别这次结果可用,但并不是期待中的那样
而在询问剧照出处时,第一次在 PC 端尝试,豆包并没有给出有用答案;第二次在 App 端得到了反馈,但结果错误。这张其实是《重启人生》的剧照。
第一次尝试
第二次尝试
最后,我们通过豆包拍照功能拍摄了一个机器人手办,其识别表现尚可。
总结
不断增加新 AI 能力,对 AI 助理产品来说终归是好事。此次豆包新加入的图片解读能力,总体来说表现中规中矩,有时候会出现没法给出答案的情况。希望字节跳动继续优化相关功能,让未来的 AI 能力变得更可靠。
- - - - - - - - END - - - - - - - -
精彩好文值得推荐!
一键转发,戳个在看!
来源:动点科技一点号
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!