鸟吧 关注:405,176贴子:5,092,027
  • 12回复贴,共1

测试目前的ai大模型面对懂鸟识别不出来的难图准确率如何

只看楼主收藏回复

测试选手是豆包,gpt o3 ,gemini 2.5pro(就这仨别问为什么这么少,因为懒)其中豆包是国内主流大模型之一,另外两个榜一榜二的t0选手。
我这里选取了四张鸟图,均取自鸟吧
这里先说结果,之后楼下发每个ai的回答情况
豆包面对四个鸟图正确率为1 /4
gpt o3 正确率为 2.5/4
gemini 2.5pro正确率为 3/4


IP属地:北京来自Android客户端1楼2025-07-11 00:49回复
    第一个,银喉长尾山雀
    其中豆包的答案是珠颈斑鸠 (多少沾点离谱)
    另外两个答案均为银喉长尾山雀



    IP属地:北京来自Android客户端2楼2025-07-11 00:52
    收起回复
      2025-11-25 14:14:08
      广告
      不感兴趣
      开通SVIP免广告
      第二个 红尾伯劳
      豆包给出的答案是,棕尾伯劳(不是吉林有这玩意嘛
      gpt o3给出的答案是,棕背伯劳,但是拉丁学名是正确的,因此算半对(看样子是正确识别出来了但是中文水平拉后腿了
      gemini 2.5pro的答案是正确的





      IP属地:北京来自Android客户端3楼2025-07-11 00:58
      回复
        第三个,红嘴鸥
        全军覆没太难了属于
        三个ai给出的答案都是棕头欧





        IP属地:北京来自Android客户端4楼2025-07-11 01:01
        收起回复
          第四个白鹡鸰
          全部回答正确还是太简单了看来


          IP属地:北京来自Android客户端5楼2025-07-11 01:02
          回复
            目前可以说谷歌的gemini是最懂鸟的ai了,不过刚刚老马的grok出了4据说很强,有可能超越gemini的懂鸟水平,目前太贵了测不起 。不过grok3懂鸟水平基本和豆包做一桌


            IP属地:北京来自Android客户端7楼2025-07-11 01:09
            回复
              有把吧里的各种夜鹭图拿去测测吗?应该可以单开一个贴子了


              IP属地:江苏8楼2025-07-11 08:59
              收起回复