
北京时间6月28日上午,随着H组末轮终场哨响,2026美加墨世界杯小组赛正式收官。A到L共12个小组、72场比赛、215粒进球——48支球队经过三轮单循环厮杀,32张淘汰赛门票各归其主。
如果说本届世界杯小组赛教会了我们一件事,那就是:别猜了,猜不中的。
黑马佛得角——一个人口仅55万的西非岛国,首次踏上世界杯舞台,三战三平(0比0逼平西班牙、2比2战平乌拉圭、0比0闷平沙特),硬生生以小组第二的身份挤掉两届世界杯冠军乌拉圭,闯进32强。淘汰赛首轮,他们将正面硬刚卫冕冠军阿根廷。足球记者们已经在排队写童话了。
乌拉圭的出局是本届小组赛最大的地震。坐拥巴萨队长阿劳霍和皇马队长巴尔韦德,三场小组赛2平1负仅积2分,门将穆斯莱拉三场三次致命失误,创造了球队24年来最差战绩。韩国队原本指望着乌拉圭翻车给自己让路,结果自己也只拿到3分,最终双双回家。韩国国脚每人35.5万人民币的晋级奖金,只能留到下届再领了。
佛得角旁边的H组老大西班牙则以7分稳稳拿下小组头名,以一种“计划有变,准备夺冠”的姿态走进淘汰赛。
射手榜上,老中青三代同台飙戏。梅西小组赛3场6球领跑,世界杯历史总进球数来到19球,连续7场世界杯进球——每一项都是历史第一。姆巴佩4球2助攻,哈兰德世界杯首秀3场4球、射门转化率干到40%。C罗41岁了,还在场上奔跑,最后一届世界杯,每跑一步都是告别。
AI能够预测阵容、算数据、算概率,但你算不到佛得角门将沃齐尼亚在乌拉圭的狂轰滥炸下扑出7次射门,也算不到穆斯莱拉三次把球往自家门里送。
但——这不影响我们AI预测的“赛博斗蛐蛐”。
早在6月11日、世界杯开赛前一天下午,大模型之家编辑部就把6大主流AI助手拉到同一张任务卡面前,要求它们从小组赛一路预测到总决赛,全程不可中断,不能回头修改。这更像是一场“长链推理压力测试”:不仅要猜得准,还得撑得住,把48队→32强→16强→8强→半决赛→决赛的完整逻辑链条通下来。
参战阵容:Qwen3.7-Max、百度文心5.1(思考模式)、豆包(专家模式)、DeepSeek(快速模式)、ChatGPT(思考模式)、Gemini 3.5 Flash(扩展思考)。原本还有元宝Hy3 preview,但因为输出链路过长、超出系统限制而提前“出局”——事实证明,连AI都会被世界杯的长度压垮。
胜负场:Qwen3.7猜得最准
先看最硬核的数据——每场比赛猜胜负猜比分,72场小组赛逐一对照。

Qwen以46场胜负正确、9场比分命中的成绩,在这个维度上一骑绝尘。46/72的胜场判断准确率达到63.9%,意味着10场比赛里它能猜对超6场的输赢方向——考虑到世界杯小组赛本来就充满冷门,这个成绩已经相当能打。
DeepSeek虽然猜对44胜场数排第三,但比分命中率跟文心、ChatGPT并列8场,占11.1%。比分命中意味着连进球数都一对一对上了,这难度比单纯猜胜负翻了不止一个数量级——毕竟把佛得角0比0西班牙这种比分蒙对,已经不是数据能解释的了。
豆包以胜场数45场排第二,仅次于Qwen,比Gemini多2场,比文心和ChatGPT多3场。如果你在小组赛前几日告诉我“豆包的专家模式猜世界杯比GPT还准”,我会建议你去测一下体温。现在体温计还给你,是在下冒昧了。
猜出线名额,文心、GPT球队猜中最多
只看胜负数据是不够的。世界杯真正的核心问题是——谁能从小组里杀出来?
大模型之家把每个AI助手预测的32强名单拉出来,跟实际出线的32支球队逐一对照,结果如下:

文心和ChatGPT双双猜对28支球队,命中率87.5%——在32支晋级队伍里,每模型只漏了4个,堪称“大数据算命”的典范。其中,文心预测的32强名单里包含了澳大利亚、加纳、塞内加尔等非传统豪强——这些球队在赛前普遍不被看好,文心的策略就是:不赌冷门博眼球,靠扎实的判断力把该拿的分全部拿到,这种策略不花哨但有效。
预测某队“会出线”是一回事,预测它以什么名次出线、从哪个位置进入淘汰赛对阵树,是另一回事。在世界杯这种单败淘汰制里,名次错了,后续所有对阵匹配都会错——就像你算对了地铁线路但搞错了方向,虽然到站了,但来的不是你要换乘的那班车。
所以如果加上名次匹配条件——第1名需精确命中第1名、第2名需精确命中第2名、第3名需精确命中第3名——排行榜立即洗牌:

Gemini 12个小组第一全中。在K组这个本届最大的“预测坟场”——5个模型全部猜葡萄牙第1、哥伦比亚第2,实际结果恰好相反——只有Gemini一人押对了哥伦比亚。凭这一组双响,Gemini在“名次匹配”维度上以24分断层领先,甩开第二名Qwen整整1分。
反观ChatGPT,虽然32强猜对28个跟文心并列第一,但名次误判率偏高——第1名只对了10个,第2名对了7个,导致名次匹配得分从28骤降到21,跟文心并列第三。DeepSeek则因为第3名预测只对了2个(总內8个最好第3名),直接垫底。
这意味着,Gemini凭借更精准的名次预测,在淘汰赛对阵树中占据了先发优势——它的后续预测路径由于匹配正确,将拥有更高的对阵连续性。而其他模型即便猜对了出线球队,由于名次错位,淘汰赛的对阵匹配会出现大量“队名不匹配、自动判错”的尴尬局面。
最后大模型之家还是要提醒大家,AI预测世界杯就是个赛博斗蛐蛐。把几个大模型关在一个竞技场里,喂同样的赛程信息,看谁猜得更准——本质上跟你跟朋友赌啤酒的性质差不多,只不过AI不会喝醉,也不会因为主队输了砸电视。
不确定性才是足球这类竞技体育的魅力所在。随着淘汰赛今天正式开打。32强对阵已经落位,阿根廷vs佛得角、巴西vs日本、西班牙vs南非……每一场都可能继续打脸,也可能让某个AI模型的预测突然封神。
西班牙会如Qwen、文心、ChatGPT三人联手押注的那样捧起大力神杯吗?Gemini的“先发优势”能在淘汰赛中兑现吗?DeepSeek和豆包还有没有翻盘的机会?让我们共同期待六大AI决战2026世界杯之巅!
附:各模型预测结果






原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/16648