测试选手是豆包,gpt o3 ,gemini 2.5pro(就这仨别问为什么这么少,因为懒
)其中豆包是国内主流大模型之一,另外两个榜一榜二的t0选手。
我这里选取了四张鸟图,均取自鸟吧
这里先说结果,之后楼下发每个ai的回答情况
豆包面对四个鸟图正确率为1 /4
gpt o3 正确率为 2.5/4
gemini 2.5pro正确率为 3/4

我这里选取了四张鸟图,均取自鸟吧
这里先说结果,之后楼下发每个ai的回答情况
豆包面对四个鸟图正确率为1 /4
gpt o3 正确率为 2.5/4
gemini 2.5pro正确率为 3/4























