测试目前的ai大模型面对懂鸟识别不出来的难图准确率如何_鸟吧_百度贴吧

11月25日漏签0天

鸟吧关注：405,176贴子：5,092,027

12回复贴，共1页

测试目前的ai大模型面对懂鸟识别不出来的难图准确率如何

只看楼主收藏回复

测试选手是豆包，gpt o3 ，gemini 2.5pro（就这仨别问为什么这么少，因为懒

）其中豆包是国内主流大模型之一，另外两个榜一榜二的t0选手。
我这里选取了四张鸟图，均取自鸟吧
这里先说结果，之后楼下发每个ai的回答情况
豆包面对四个鸟图正确率为1 /4
gpt o3 正确率为 2.5/4
gemini 2.5pro正确率为 3/4

送TA礼物

IP属地:北京

来自Android客户端1楼2025-07-11 00:49回复

第一个，银喉长尾山雀
其中豆包的答案是珠颈斑鸠（

多少沾点离谱）
另外两个答案均为银喉长尾山雀

IP属地:北京

来自Android客户端2楼2025-07-11 00:52

收起回复

不感兴趣

开通SVIP免广告

第二个红尾伯劳
豆包给出的答案是，棕尾伯劳（不是吉林有这玩意嘛

）
gpt o3给出的答案是，棕背伯劳，但是拉丁学名是正确的，因此算半对（看样子是正确识别出来了但是中文水平拉后腿了

）
gemini 2.5pro的答案是正确的

IP属地:北京

来自Android客户端3楼2025-07-11 00:58

第三个，红嘴鸥
全军覆没

太难了属于
三个ai给出的答案都是棕头欧

IP属地:北京

来自Android客户端4楼2025-07-11 01:01

收起回复

第四个白鹡鸰
全部回答正确还是太简单了看来

IP属地:北京

来自Android客户端5楼2025-07-11 01:02

目前可以说谷歌的gemini是最懂鸟的ai了，不过刚刚老马的grok出了4据说很强，有可能超越gemini的懂鸟水平，目前太贵了测不起。不过grok3懂鸟水平基本和豆包做一桌

IP属地:北京

来自Android客户端7楼2025-07-11 01:09

有把吧里的各种夜鹭图拿去测测吗？应该可以单开一个贴子了

IP属地:江苏

8楼2025-07-11 08:59

收起回复

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

12回复贴，共1页

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴