找回密码
 立即注册
搜索

本文来自

灌水乐园

灌水乐园

人已关注

请添加对本版块的简短描述

精选帖子

为什么克罗地亚这么倒霉,为什么葡萄牙被高估了,以及为什么瑞典人最冤枉

[复制链接]

3418

主题

3420

帖子

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
12150
1290 admin 发表于 2018-9-11 20:01:51
[伪定量] 为什么克罗地亚这么倒霉,为什么葡萄牙被高估了,以及为什么瑞典人最冤枉
足球·足球场关于国际足联世界杯历史总积分榜:为什么克罗地亚这么倒霉,为什么葡萄牙被高估了,以及为什么瑞典人最冤枉?*原创内容,转载请注明出处:红军王朝.(2018, July 18th). 关于国际足联世界杯历史总积分榜:为什么克罗地亚这么倒霉,为什么葡萄牙被高估了,以及为什么瑞典人最冤枉?[weblog]. Retrieved from22943964.html引言六年前,被寄予厚望的德国在欧锦赛中被老冤家意大利挡在决赛之外。我辗转反侧难以入眠,虽早就已不再有刚看球时的那种痛不可当、撕心裂肺的情绪,但宝宝还是不开心的。在房间里浏览着电脑屏幕上各方群体对比赛的不同解读和对自己情绪的不同表达,我竟莫名涌动着一股抑制不住的想要寻找这些零散的评论背后的真相并以严整的文字将其表达出来的冲动,于是便有了第一次关于足球话题的严肃写作:《弄点数据替勒夫说点话》。六年后,德国以世界杯卫冕冠军之尊干脆玩了一波更大的:“德国足球现在什么水平?就这么几个人你臀新什么的都在踢中锋,他能踢吗?踢不了,长得太萌知道吗……墨西哥输完输韩国再输英格兰,接下来没人输了……脸哥踢中锋踢得蛮好的你把他换了去干什么你告诉我——在俄罗斯输个0比2,你倒告诉我怎么解释呢?脸都不要了”,然后我的写作冲动貌似又跟着发作了——看来以后若要文思泉涌还要多多仰仗我大德国的发挥呢。只不过此次我打算把对德国惨败的研究兴趣暂且放在一边,而试图更加细致深入地去探讨一个在那篇六年前的文章中曾粗略讨论过的小主题:如何衡量各支球队在世界杯历史中的总体表现?目前官方的测量方式,即:国际足联世界杯历史总积分榜(All Time Table of the FIFA World Cup),是将整个世界杯决赛阶段的历史比拟成一个超级大联赛并通过累加计算每支参加过世界杯决赛阶段的球队的总积分来比较历史总成绩,而具体的积分计算方式则是采用和联赛相同的三分制:获胜得3分,平局得1分,而失利则为0分[3]。值得注意的是,通过点球大战决出胜负的比赛在这个算法中也一律视为平局[3]。如此便构成了一个庞大的贯穿时空且包罗万象的世界杯历史总积分榜。从中我们可以清晰地看到,获得世界杯冠军次数最多的三支球队:巴西、德国和意大利分别位列三甲,而其他几支世界杯冠军得主也都名列前茅[18],因此这似乎都在体现着这个积分榜的准确性。但是我们仍然要对这种累加积分算法的效度抱有极大的质疑和反思。在本文中,我们将尝试从四个不同的角度来详细分析这种积分算法所造成的潜在测量误差:1.变量的不同测量尺度;2. 政治因素对世界杯参与的影响;3. 小组赛积分与球队真实表现的关系;4. 小组赛和淘汰赛的权重与意义。在展开论述之前,有几点原则值得事先说明:1. 出于减少计算量和信息量的需要,我们的讨论将以欧洲球队在世界杯上的成绩为主要样本,但是在具体分析中不排除援引其他各洲球队的案例作为辅助材料;2. 出于同样的需求,我们仅仅选取1986年到2014年共八届世界杯作为研究的范畴,文中所有涉及时间的讨论如无特别说明则都默认是在此时间范围之内生效。这是因为这一阶段的世界杯赛制较为统一,都是由六个阶段构成:预选赛、小组赛、十六强赛、四分之一决赛、半决赛和决赛[19],而这将有助于避免因赛制不同而对最终的结论产生不必要的干扰;3. 虽然1994年之前的世界杯一直都采用两分制,即胜一场得2分[22],但是为了统一计算过程,所有赛事的积分将全部按照当下通行的三分制进行重新换算。在这三个原则下,我们重新罗列出欧洲球队在1986年到2014年世界杯期间的历史总积分榜供大家参考(见表1)。表1欧洲球队世界杯决赛阶段历史总积分榜(1986-2014)排名球队参赛次数比赛场次总积分1德国[1]8521142意大利840753西班牙836704荷兰634665法国632606英格兰733517比利时627408葡萄牙520288丹麦4162610克罗地亚4162311瑞典41822罗马尼亚31322瑞士4152214塞尔维亚[2]4152015俄罗斯[3]51618
表2欧洲球队世界杯决赛阶段场均积分榜(1986-2014)排名球队参赛次数比赛场次总积分场均积分1德国[1]8521142.192西班牙836701.94荷兰634661.944意大利840751.88法国632601.886土耳其17131.867罗马尼亚313221.698丹麦416261.639英格兰733511.5510捷克[2]28121.50
表3欧洲球队世界杯决赛阶段小组赛总积分榜(1986-2014)排名球队参赛次数小组出线次数小组赛场次小组赛总积分1德国[1]8824542西班牙8624493意大利8624414荷兰6618395英格兰7621336比利时6518337法国6418308葡萄牙5215249丹麦43122310瑞士43122111俄罗斯[2]51151812罗马尼亚3391713塞尔维亚[3]42121614瑞典43121515克罗地亚411214
表4欧洲球队世界杯决赛阶段小组赛和淘汰赛积分对比(1986-2014)排名球队总积分小组赛淘汰赛场次积分场次积分%场次积分%1德国[1]52114245447%286053%2意大利4075244155%163445%3西班牙3670244970%122130%4荷兰3466183959%162741%5法国3260183050%143050%6英格兰3351213365%121835%7比利时2740183383%9718%8葡萄牙2028152486%5414%9丹麦1626122388%4312%10克罗地亚1623121461%4939%11瑞典1822121568%6732%罗马尼亚132291777%4523%瑞士1522122195%315%14塞尔维亚[2]1520121680%3420%15俄罗斯[3]16181518100%100%
表5世界杯决赛阶段小组赛积分差值可能性排列组合(32队赛制)积分差=小组出线球队积分?小组出局球队积分2?0=22?1=12?2=02?3=-12?4=-22?5=-32?6=-43?0=33?1=23?2=13?3=03?4=-13?5=-23?6=-34?0=44?1=34?2=24?3=14?4=04?5=-14?6=-25?0=55?1=45?2=35?3=25?4=15?5=05?6=-16?0=66?1=56?2=46?3=36?4=26?5=16?6=07?0=77?1=67?2=57?3=47?4=37?5=27?6=19?0=99?1=89?2=79?3=69?4=59?5=49?6=3
我要赞赏9人推荐我要推荐转发到:
在单败淘汰赛中,一种比较通行的算总积分的方法是:获胜积三分,失败积零分,平局各积一分,常规时间之后获胜的再积一分。这样的算法中晋级的价值是三分,而即便没能晋级,如果能够将比赛拖入加时也可以从对手身上抢得一分。先不考虑小组赛,世界杯的赛程特点是十六强后有十六场比赛(每场比赛淘汰一只球队,再加上三四名决赛),所以进入十六强/八强/四强后球队继续拿分的期望都是3分。这也和我们之前算的晋级的价值是一样的。因为小组阶段三场比赛实际意义上就相当于一场32进16的淘汰赛,所以应该和淘汰赛阶段一样,晋级的球队得三分,未晋级的球队不得分。不过小组赛作为正赛的第一轮,能够晋级到正赛本身的价值其实也应该加进去。如果晋级正赛的价值也按三分来算,那么依照小组排名先后,我们应该分别给6,6,3,3分。这样其实和目前按照实际积分来算就差不多了,积分总和甚至比起目前按照小组实际积分的算法只多不少。所以我觉得与其再另作规定,不如就用小组的实际积分,这样还能体现每场比赛的实际结果。
谁概括一下zszszszs
哇,这引用,真的写论文了
哇,这引用,真的写论文了我老师如果看到我的参考文献基本都是维基百科估计是要打死我????
在单败淘汰赛中,一种比较通行的算总积分的方法是:获胜积三分,失败积零分,平局各积一分,常规时间之后获胜的再积一分。这样的算法中晋级的价值是三分,而即便没能晋级,如果能够将比赛拖入加时也可以从对手身上抢得一分。先不考虑小组赛,世界杯的赛程特点是十六强后有十六场比赛(每场比赛淘汰一只球队,再加上三四名决赛),所以进入十六强/八强/四强后球队继续拿分的期望都是3分。这也和我们之前算的晋级的价值是一样的。因为小组阶段三场比赛实际意义上就相当于一场32进16的淘汰赛,所以应该和淘汰赛阶段一样,晋级的球队得三分,未晋级的球队不得分。不过小组赛作为正赛的第一轮,能够晋级到正赛本身的价值其实也应该加进去。如果晋级正赛的价值也按三分来算,那么依照小组排名先后,我们应该分别给6,6,3,3分。这样其实和目前按照实际积分来算就差不多了,积分总和甚至比起目前按照小组实际积分的算法只多不少。所以我觉得与其再另作规定,不如就用小组的实际积分,这样还能体现每场比赛的实际结果。哦~这种算法我还真没听过,找找资料时发现貌似很少有人讨论过世界杯总成绩的算法,不知可否提供出处来源~另外,我觉得这种算法虽然可能解决了小组赛和淘汰赛的权重问题,但是文中所讨论的其他两个测量偏差并没有得到解决(测量尺度、非正常缺席)。本质原因仍然是积分算法的特征造成的,因为积分算法的逻辑本质上是建立在每场比赛均等的基础上的(每场比赛都是3分),这和世界杯的赛制是不符合的。虽然你提到的这个算法可能解决了小组赛权重被夸大的问题,但仍然可能出现问题,比如小组赛晋级的球队得到6分,这个赋值我个人仍然觉得有点夸大,因为这相当于赢下两场淘汰赛的积分了。因此我觉得有必要跳出积分的算法逻辑来重新评估世界杯总成绩的测量方式。我在6楼贴出了另一种算法,并简单讨论了这种算法存在的问题,FYI~[此帖被红军王朝在2018-07-19 15:12修改]
补充一中可能的测量方式及其对应结果供大家参考(见表6)表6欧洲球队世界杯历史总成绩量表(1986-2014)排名球队19861990199419982002200620102014平均值1德国214423312.502意大利532451664.003西班牙454645164.384法国377162644.505荷兰754375234.506英格兰437544564.757比利时355657745.258克罗地亚///366765.609葡萄牙677763565.88瑞典763755775.8811丹麦577457676.00塞尔维亚74/576676.0013瑞士775775656.13罗马尼亚754577776.1315俄罗斯566767766.25
罗马尼亚亮了,90年代绽放的黄玫瑰
因为用别的分数排序会引起争议 比如凭啥冠军就是亚军的两倍或者1.5倍 所以fifa才搞了310累加另外十六强被淘汰球队就一定比八强被淘汰球队差吗?这是楼主的定义,要考虑输给的对手的话那还真不一定,单败淘汰的比赛偶然程度比较大,这时候一味强调晋级的阶段来决定成绩我认为也不准。
因为用别的分数排序会引起争议 比如凭啥冠军就是亚军的两倍或者1.5倍 所以fifa才搞了310累加另外十六强被淘汰球队就一定比八强被淘汰球队差吗?这是楼主的定义,要考虑输给的对手的话那还真不一定,单败淘汰的比赛偶然程度比较大,这时候一味强调晋级的阶段来决定成绩我认为也不准。可以参考6楼给出的计算方式和相关讨论。至于“十六强被淘汰球队就一定比八强被淘汰球队差吗”,答案当然是不一定。但是本文的关注点其实准确的说是客观上的战绩——或者说硬指标,从这个角度上来说确实四分之一决赛的球队的战绩要比十六强赛的球队好。而如果说到球队之间的优劣,这个本身就具有很强的主观色彩,比如2006年世界杯有人觉得西班牙虽然十六强就被法国淘汰,但表现仍然要比闯入四分之一决赛的乌克兰出色,仅仅是因为西班牙提前遭遇强敌,换个个让乌克兰去踢法国,目测被提前淘汰的就是乌克兰而不是西班牙了。再比如也有人可能认为一个人口小国能够闯进世界杯淘汰赛的成就也要比人口大国进入决赛的成绩要更加难能可贵。甚至于有的球队进入了决赛,球迷都未必能满意——如果最后拿不到冠军的话,而有的球队仅仅是能从小组赛取得哪怕一个积分,自家球迷就已经心满意足开心的不得了了。这种主观上对球队成绩表现的评估不再本文讨论范围之内。当然,考虑输给的对手确实很有道理,输给法国和战胜沙特阿拉伯确实不能一概而论。但是世界杯的抽签分组和随之产生的分区基本上是一个随机抽样过程,因此各支球队会遭遇哪一支球队,基本上也是随机的,既然是随机的,那么这个变量就不成为干扰变量,因而也就不会对讨论结果产生太重大的干扰
楼主是很用心,的确也倾注了很大的热情,然而容我问个煞风景的问题:“国际足联世界杯历史总积分榜”这个东西很重要吗?它的价值,跟咱们花那么大工夫去争议怎么算才科学相比,值得吗。据我所知,这个东西并不涉及什么荣誉、也不涉及每届小组种子队设置
楼主是很用心,的确也倾注了很大的热情,然而容我问个煞风景的问题:“国际足联世界杯历史总积分榜”这个东西很重要吗?它的价值,跟咱们花那么大工夫去争议怎么算才科学相比,值得吗。据我所知,这个东西并不涉及什么荣誉、也不涉及每届小组种子队设置首先,你问的这个问题还真不是一个煞风景的问题,而是任何研究都必须要扪心自问的问题。至于具体到本文主题的重要性,这个看你怎么看了。老实说,这篇文章其实和我们熟知的球员、战术之类的主题基本不沾边,甚至就算是世界杯后发表的,其实和本届世界杯也没有直接关系。但我仍然认为自己研究的主题还是有点价值的:1. 虽然统计学和定量研究确实很枯燥乏味,但是在大数据时代,其实任何领域的定量研究都是越来越受重视的,当然也包括足球;2. 对足球来说,其实成绩就是最重要的一个统计数据——虽然并不是唯一,我们也不打算强调“唯成绩论”的足球价值观。尽管如此,从统计学上对成绩和表现的评估一直是足球最重要的主题——比如比分、积分这些我们熟悉的概念其实本质上就是一种统计手段。而我们经常看到大家对于哪支球队发挥得好哪支球队发挥得差争论的焦得头破血流,说到底就是缺乏一个大家都认可的测量工具和标准:你觉得拿过一次世界杯就牛逼哄哄,他觉得三次进决赛三次亚军也是很牛逼的成绩,于是开始噼里啪啦打成一团;3. 就我目前看到的文献,对世界杯历史战绩的客观评估的研究似乎几乎没有,而唯一算是官方认可的评估标准就是文中猛烈diss的国际足联世界杯历史总积分榜,白纸黑字写在国际足联官方网站上,因此尽管是目前唯一一个官方的测量标准,我们仍然认为必须critical thinking,尤其是当我们发现所谓官方的测量其实有很大问题时。
我觉得能不能借鉴电竞中的ELO积分来量化国家队成绩呢,这个应该比简单粗暴的310积分累加科学吧
看了小组赛和淘汰赛分开的积分榜,才发现意大利是淘汰赛得分率最高的球队,难怪大家都害怕他们小组出线。
我觉得能不能借鉴电竞中的ELO积分来量化国家队成绩呢,这个应该比简单粗暴的310积分累加科学吧国际足联最新的国家队排名算法已经开始采用elo算法了,算是一个统计学上的进步吧
楼主这个apa的参考文献格式让我想起来高中国际班的论文课了2333,现在基本一直挣扎在mla和芝加哥当中无法自拔……
首先,你问的这个问题还真不是一个煞风景的问题,而是任何研究都必须要扪心自问的问题。至于具体到本文主题的重要性,这个看你怎么看了。老实说,这篇文章其实和我们熟知的球员、战术之类的主题基本不沾边,甚至就算是世界杯后发表的,其实和本届世界杯也没有直接关系。但我仍然认为自己研究的主题还是有点价值的:1. 虽然统计学和定量研究确实很枯燥乏味,但是在大数据时代,其实任何领域的定量研究都是越来越受重视的,当然也包括足球;2. 对足球来说,其实成绩就是最重要的一个统计数据——虽然并不是唯一,我们也不打算强调“唯成绩论”的足球价值观。尽管如此,从统计学上对成绩和表现的评估一直是足球最重要的主题——比如比分、积分这些我们熟悉的概念其实本质上就是一种统计手段。而我们经常看到大家对于哪支球队发挥得好哪支球队发挥得差争论的焦得头破血流,说到底就是缺乏一个大家都认可的测量工具和标准:你觉得拿过一次世界杯就牛逼哄哄,他觉得三次进决赛三次亚军也是很牛逼的成绩,于是开始噼里啪啦打成一团;3. 就我目前看到的文献,对世界杯历史战绩的客观评估的研究似乎几乎没有,而唯一算是官方认可的评估标准就是文中猛烈diss的国际足联世界杯历史总积分榜,白纸黑字写在国际足联官方网站上,因此尽管是目前唯一一个官方的测量标准,我们仍然认为必须critical thinking,尤其是当我们发现所谓官方的测量其实有很大问题时。这个统计,或许能比较严谨的把“底蕴”给描述出来。然而世界杯首先4年才一届,连续性比较差,其次国家队这个东西你也讲了:存在历史继承等问题,其实个中很多评判标准是很难避免主观的,所以我比较怀疑其意义。而且,就算有了你这们详尽的计算,我打赌球迷们该打的还是要打,该critical thinking时还是得以之为基础。要争论世界杯国家队哪家强,我个人认为什么方法最后都只能得出一个大致的结果,单届赛事都存在偶然性,比如今年克罗地亚的亚军、02年的殿军和季军。但放眼历史长河,最强的哪几家应该是范围确定的,在这个以下就是单届误差可以很大左右的众多二流强队了,说实话我觉得就是这个区间要排名的意义不大。所以不如简单的给名次赋值求和就可以了,严谨一点的话把上古几届赛制不规范、参赛队较少的权重设低点就OK了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表