[转发] 新型高阶数据科普

ʕ•ᴥ•ʔ-avatar

ʕ•ᴥ•ʔ

2022-08-01T20:44:22+00:00

高阶数据advanced stats,是很好的辅助工具,可以帮助矫正一些印象流。

但每个数据模型,都自有其缺陷。至少当下,没有完美的高阶数据,还是亲自看比赛最为直观,那么多高阶数据,哪个相对靠谱?

hoopshype的记者在去年为此专门去采访了联盟的29位球探,写出了采访结果,勇士国度翻译了这篇文章,转过来给大家看一下,文章是21年写的,所以里面提到的的球员表现指的是20-21赛季的


本文为HoopsHype记者 Bryan Kalbrosky写于当地时间2021年9月19日的长文,由勇士国度最强阵容翻译出品,我们致力于提供优质内容!

译者:包子里的小鲜肉,编辑:库迪

HoopsHype与篮球界一些最值得信赖的人进行交谈,了解到13个最先进的、公开的指标。指标排名从最受信任数据到最不受信任数据。

1.DPM



全名:Daily Plus-Minus

指标类型:评估正负值的预测工具

开发人员:科斯塔亚-梅德韦杰夫斯基(Kostya Medvedovsky )

数据来源:DARKO.app

最新领袖:扬尼斯-阿德托昆博,科怀-伦纳德,勒布朗-詹姆斯,乔尔-恩比德,凯文-杜兰特

DARKO是综合指标调查的“赢家”。这是一个由Kostya Medvedovsky开发,Andrew Patto主理的应用程序。

他们的网站将DARKO定义为“由机器学习驱动的篮球运动员技术统计预测系统”,类似于MLB的PECOTA或ZIPS。他们的应用程序每天更新每个NBA球员的数据。该应用程序的数据来源于NBA.com、Basketball-Reference和PBPStats.com。

DARKO还使用“指数衰减”和“卡尔曼滤波器”的复杂方法来考虑时间序列和样本大小,将所有历史数据考虑在内。

“这是一个巨大的突破,因为当使用回合水平(possession-level )数据时,从噪音中提取出信号是很棘手的,通常一个季度的数据不足以确保正确的统计,”爵士前分析主管Jez解释道。“梅德韦德夫斯基用DPM解决了这个问题,这让他可以自信地说,一名球员的进步是一个信号(signal)而不是噪音(noise)。”

其结果是一个贝叶斯模型,预测技术统计的所有元素。该应用程序会显示每个球员的预测能力曲线,例如外线投篮和其他特定技术统计的要素。

对于这个运用,我们特别关注它在DailyPlus Minus 2.0 (DPM)上的结果,这是DARKO的一种全面度量标准。DPM与其他指标的主要区别在于,它只面向未来。

它不会回答谁应该获得MVP,但它是一个强大的预测工具。事实上,基于均方根误差(RMSE),DPM在预测能力方面超过了其他所有面向公众的指标。紧随其后的两个最佳指标,依次是EPM和LEBRON——正如我们的调查。

虽然在业余球迷当中它的受欢迎程度不如PER,但如果你对MNA球员的评价感兴趣,是时候把DPM添加到你的指标列表中——尤其是像Dunksandthrees.com这样的网站,DARKO的应用程序也有一些很棒的数据可视化工具。

当其他人开始考虑在他们的复合指标中应该包含什么时,值得注意的是预测模型类的数据比传统的评估效果更好。

调查说明:在参与我们调查的29个人中,有8人说DPM是他们首选的万能指标,是所有指标中最高的。另外10个人说他们相信DPM是一个一体化的指标,只有1人不这么认为。

2.EPM

全称:估计正负值(Estimated Plus-Minus)

指标类型:技术统计和on-off影响(预期的的RAPM)

开发人员:泰勒-斯纳尔(Taylor Snarr)

数据:Dunksandthrees.com

最新领袖:尼古拉-约基奇,鲁迪-戈贝尔,斯蒂芬-库里,勒布朗-詹姆斯,科怀-伦纳德

从这项研究中我们可以发现的一个不足为奇的趋势是,新指标往往比旧指标更值得信任,而估计正负值(EPM)的普及就是一个明显的例子。

EPM由数据科学家、前犹他爵士队篮球分析协调员泰勒·斯纳尔开发。当他在2020年2月引入EPM时,他形容这是“最精确的”一体化NBA球员的指标。

科学也证明了这一点。根据一项比较研究,EPM在分析球场上有影响力球员方面的工作做得最好。您可以在这里看到结果,但值得注意的是,指标比较的结果实际上与本次调查中提供的答案非常相似。

一位现任东部球队分析人员告诉HoopsHype,他认为这项研究设置得很好,并指出EPM与其他指标相比要更好:

“我想说,我最喜欢EPM的部分是,他整合了一项研究,显示了与其他指标相比EPM更有效的原因。我一直在想为什么没人这么做。如果你的指标更好,那就告诉我原因,不要只是告诉我它是什么。”

该分析师补充说,通常表现最好的一体化指标是经过调整的正负值指标,包括先前的指标。

与此同时,与后文将提到的RPM和RAPTOR一样,Snarr的EPM是一种混合模型,它使用球员追踪数据作为评估的一部分。

Steve Ilardi是ESPN“Real Plus-Minus”的创始人之一,曾为包括菲尼克斯太阳队在内的NBA球队担任顾问,我们询问了他对这个指标的看法。

Steve表示:“EPM通过整合贝叶斯先验(贝叶斯先验不仅来自于统计数据,还来自于球员追踪指标)降低基本RAPM建模估计中固有的高噪声水平。EPM比我和杰瑞·恩格尔曼(JerryEngelmann)为ESPN开发的RPM更进一步,因为我们开始这个项目时没有获得球员跟踪指标。”

Steve补充道:“我认为EPM显然是一体化指标的黄金标准。”



此外,EPM不仅是可信的,而且网站看起来也很现代。这是一个很好的变化,因为其他一些显示指标的网站已经过时了,而且很难看到EPM。

Dunksandthrees.com还提供了很棒的用户体验,不仅包括奇妙的数据可视化,还有对防守和控球等技能的彩色编码效率评级。

调查表示:在参加我们调查的29个人中,有6个人说EPM是他们首选的万能指标。在所有指标中排名第二。另有11人表示,他们相信EPM是一个一体化的指标,只有1人表示不相信。

3. LEBRON



全称: Luck-adjusted player Estimate using a Box prior Regularized ON-off

指标类型:技术统计和on-ff影响(事先知情的RAPM)

开发者:Krishna Narsu, Tim/Cranjis McBasketball

数据:BBall-Index.com

最新领袖:尼古拉-约基奇,鲁迪-戈贝尔,扬尼斯-阿德托昆博,吉米-巴特勒,乔尔-恩比德

在过去几年里,一个越来越受欢迎的新指标是BBall-Index.com的LEBRON。虽然它才刚出现,但到目前为止它的表现相当好。

这个指标使用技术统计和on-ff计算(特别是,运气调整值的RAPM)的影响分数测量每百回合。LEBRON的技术统计部分使用了PIPM(球员影响力正负值)权重。

PIPM,现在已不再公开提供的数据,由雅各布·戈尔茨坦(Jacob Goldstein)创建,他在被雇佣于华盛顿奇才队(Washington Wizards)、华盛顿神秘队(Washingtonmystery)和首都Go-G队之前,曾在ball-index工作。

为了达到稳定的目的,他们整合了自己的进攻原型,即根据球员在球队中扮演的角色给他们贴上标签。根据该网站的说法,LEBRON是唯一一个“利用实际的RAPM计算来衡量角色调整、稳定和运气调整值”的影响力统计数据。

ball-index还提到,“下一代”LEBRON将纳入跟踪数据。

调查说明:在参与调查的29个人中,有4个人说LEBRON是他们最喜欢的万能指标。另外14人说他们相信LEBRON是一个全能的分析数据模型,而有2人表示他们不相信这一指标。

4.RAPTOR(关于数据统计和球员在场和不在场时球队表现差异的高阶数据)



全称:Robust Algorithm (using) Player Tracking (and) On/Off Ratings

指标类型:混合球员跟踪数据和正负值的技术统计

开发者:Jay Boice, Neil Paine和Nate Silver

数据来源:FiveThirtyEight.com

最新领导者:尼古拉-约基奇,乔尔-恩比德,鲁迪-戈贝尔,科怀-伦纳德,迈克-康利

在数据世界里,或许最家喻户晓的名字就是内特•西尔弗(Nate Silver),他的FiveThirtyEigh有一个被广泛引用的全能篮球指标:RAPTOR。

FiveThirtyEight之前的篮球指标(Elo和cam -Elo)依赖于BPM和RPM进行计算。但2019年推出的RAPTOR提供了数据科学家的原始见解。这项评估融合了技术统计数据、实况数据、球员追踪数据和on-off。

RAPTOR,它包括大量的描述性数据,如快攻,单打失误和外线防守者的运动距离。

一位高管告诉HoopsHype他们更喜欢RAPTOR,因为它的创建方式与其他指标截然不同,他们认为它是一种有用的“稳健性”指标。

RAPTOR是值得备受推崇的指标。然而,研究表明,它的局限性是当数据样本量较小(上场时间)或球队花名册每年有大量球员更替时,RAPTOR将不起作用。

调查显示:在参与我们调查的29名个人中,有6人说,RAPTOR是他们首选的全面指标,这使它在这方面排名第三。另有8人表示,他们相信RAPTOR是一种一体化指标,但另有7人表示不相信。

5.RAPM



全称:Regularized Adjusted Plus-Minus

指标类型:球员在场和不在场时球队表现差异(不包含技术统计数据)

开发人员: 乔·锡尔 Joe Sill

数据:NBAShotCharts.com

最近的领袖*(* =基于5年RAPM):斯蒂芬·库里,克里斯·保罗,勒布朗·詹姆斯,字母哥,鲁迪·戈贝尔

正则化的调整正负值(RAPM)是基于调整正负(APM)的基本原理,即将线性代数应用到技术统计的标准正负值中。

但与APM的主要区别是, RAPM应用了一个线性回归滤波器来解释正则化(regularization)。 你可以在这里学习更多关于贝叶斯过程的知识,也可以在这里阅读关于RAPM的历史。

然而,关于这些计算最重要的事情之一是,当涉及到RAPM时需要了解预先知情和非事先知情之间的区别。

对正负值(如RAPM)“先验(priors)”的使用让某些指标能够在第一眼就通过“取样测试(sniff test)”。 犹他州爵士队前分析主管杰斯给出了一个简单的解释:“我们知道勒布朗·詹姆斯真的真的很棒,我们不应该等个百回合后才知道这一事实。 相反,建模者可以利用先验让模型在正确的方向上启动。”

Jez解释说,当然, 这些先验的产生是主观的,这也是强大预测指标背后的“秘密武器”。

RAPM被单独使用时也有一些明显的缺陷,主要是当一位球员在场上或不在场上时,除了得分外,像篮板或助攻这样的有“篮球”价值的数据没有并没有被考虑。

尽管RAPM忽略了传统的数据统计元素,但它作为其他流行的综合指标(如EPM)中的基本组成部分, 对衡量球员在场影响因素非常有帮助。

值得注意的是,一些受访者还告诉HoopsHype,这个指标在研究多年的结果(如3年和5年的RAPM)时最有用,单季数据可能会产生误导。

西部某支球队的一名分析主管表示:“这需要从球员及其角色的角度来考虑。但 当你有多个赛季的球员数据时,这是一个很好的客观衡量标准。 ”



调查显示:在参与我们调查的29个人中,超过一半(15人)说他们相信正规化调整加减(RAPM)是一个一体化的指标,只有2人说他们不相信。但没有人说,RAPM是他们首选的万能指标。


6.BPM



全称:Box Plus-Minus

指标类型:技术统计(估计球员正负)

开发人员:丹尼尔·迈尔斯(Daniel Myers)

数据:Basketball-Reference.com

最新领袖:尼古拉-约基奇,字母哥,斯蒂芬-库里,吉米-巴特勒,勒布朗-詹姆斯

BPM (Box Plus-Minus)旨在评估一个球员在场上的贡献。BPM综合了得分表现、球队表现和球员位置来评估球员每100个回合的表现是否高于联盟平均水平。

BPM与VORP(Value Over Replacement Player)本质上是相同的统计数据,但后者考虑了球员上场时间。

对于BPM来说,联盟的平均值被设定为0.0,你可以很容易地比较个人的表现(例如10.0被认为是最杰出的赛季,8.0被认为是MVP级别,4.0被认为是全明星级别,-2.0是替补球员的水平等等)。

当Daniel Myers开发BPM 2.0时,他写道,他希望他的公式只使用现成的统计数据。

与ESPN的RPM不同,这个测量方法比较简单,不包括跟踪数据。因此,尽管依赖较少的信息,但有趣的是,许多人实际上更喜欢BPM,而不是更复杂的RPM。

BPM的结果可以在Basketball-Reference找到。但同样值得注意的是,《Thinking Basketball(2016)》的作者Ben Taylor也有自己的BPM版本,许多人也表示对此数据的信任,这些结果可以在这里找到。

调查显示:在参加我们调查的29个人中,有两人说Box Plus-Minus是他们最喜欢的一体化指标。另外11人说他们相信BPM是一个有效的一体化指标,而3人说他们不相信BPM。

7.RPM



全称:Real Plus-Minus

指标类型:Box score using tracking data and on-off impact hybrid

开发者:Jeremias Engelmann, Steve Ilardi

数据:ESPN.com

最新领袖:斯蒂芬·库里,勒布朗·詹姆斯,鲁迪·戈贝尔,保罗·乔治,字母哥

ESPN于2014年推出的RPM,被誉为开启了综合指标的新时代,旨在复制统计数据的正负值,同时筛选NBA的详细数据。

RPM是继WINVAL评分(由Wayne Winston和Jeff Sagarin在2002年开发)、APM(由Dan Rosenbaum在2004年开发的调整加减)和xRAPM之后的又一个评分系统。

特别由于它在ESPN的突出位置,RPM一直被认为是调整后的正负值统计中的黄金标准。 但去年某个时候,奇怪的事情发生了。

“杰里米亚斯·恩格尔曼创造的RPM并不是目前ESPN上显示的那个,”一位在西部某支球队担任篮球分析总监的个人回应道,“我对前者的评价很高,而后者在我看来毫无用处。”



总的来说,ESPN的RPM是所有被提及指标中最具争议的。有些人甚至认为,可能是代码中有什么地方出了问题。

调查显示:在参与调查的29名受访者中,有两人表示,ESPN的真实正负值(RPM)是他们首选的一体化指标。相信RPM的有8人,不相信RPM的有11人。

8.WPA



WPA:Win Probability Added(胜利增加率)

指标类型:分数(不是估计玩家正负)

开发人员: 迈克·博伊Mike Beuoy

数据:Inpredictable.com

最新领袖:达米安·利拉德,斯蒂芬·库里,锡安·威廉姆森,尼古拉·约基奇,杰森·塔图姆

早在2014年,迈克 ·博伊就引入了获胜概率的贡献,这是为了给关键时刻的进球给予更多认可(credit)。 博伊在这里定义了他的一些方法论。

最有趣的是,他专注于投篮失误、投篮命中、失误和罚球,而忽略了篮板、助攻、盖帽和抢断。在他的网站上, 您还可以根据某位球员在关键时刻的表现与在垃圾时间的表现进行比较,对个人表现进行整理。

kitchen sink win probability added还有一个包揽一切的指标,叫做kWPA(kitchen sink win probability added),它考虑了所有的数据,比如篮板、助攻、盖帽和抢断。他们在检验关键投篮和比赛节奏方面也做得很好。

调查显示:在参与调查的29人中,有5人表示他们不相信Win Probability Added是一个有效的综合指标。回答问题的参与者中没有人说WPA是他们首选的全方位数据。

9.Simple Rating



全称:Simple Rating

指标类型:技术统计(估计球员正负值)

开发人员:Roland Beech

数据:82 games.com

最新领袖:乔尔-恩比德,字母哥,吉米-巴特勒,科怀-伦纳德,勒布朗-詹姆斯

Simple Rating是由Roland Beech开发的。2002年,他创建了82games.com,然后被达拉斯小牛队(现独行侠)聘用,成为NBA第一位“数据教练”。他曾担任达拉斯的篮球运营副总裁,并曾担任萨克拉门托国王队的篮球战略副总裁,直到2017年。

Beech 是on-off数据方面是思想领袖,他的“Simple Rating”目标是衡量一个球员在球场上的效率与另一支球队的对应球员形成对比。

值得一提的是,《Simple Rating》是唯一一个没有把约基奇列入上个赛季五个最佳球员的评价指标之一。

调查显示:在参与调查的29个人中,有5人回答说他们不相信简单评级是一个有效的综合指标。没有参与者说简单评级是他们喜欢的全面统计数据。

10.FIC



全称:Floor Impact Counter

开发人员:克里斯·雷纳

指标类型:技术统计(不是估计球员正负值)

数据:RealGM.com

最新领袖:尼古拉-约基奇,拉塞尔-威斯布鲁克,扬尼斯-阿德托昆博,尼古拉-武切维奇,卢卡-东契奇

Floor Impact Counter (FIC)是RealGM的PER和PIE版本。它是在2007年开发的,它与其他效率数据的不同之处在于,它赋予助攻、自主进攻以及进攻篮板更多的权重。

FIC有时被表述为FIC40,即一个人每40分钟的FIC。这一指标更青睐像拉塞尔-威斯布鲁克那样能填满数据的球员。但任何在过去几个赛季看过威少的人都知道,填满数据并不总是意味着胜利。

虽然它在NBA没有被广泛引用,但RealGM有其他级别的比赛数据(如大学篮球,G联赛和国际比赛),所以FIC在这些情况下肯定能派上用场。

调查显示:在29名参与调查的人中,有8人回答说他们不相信FIC是一个有效的综合指标。没有人说FIC是他们首选的全面统计数据。

11.WS / 48



全称:Win Shares per 48 minutes

指标类型:分数(不是估计球员正负)

开发人员:Justin Kubatko

数据:Basketball-Reference.com

最新领袖:尼古拉-约基奇,乔尔-恩比德,吉米-巴特勒,鲁迪-戈贝尔,扬尼斯-阿德托昆博

任何读过迈克尔·刘易斯的《点球成金》(2003)的人都对棒球中的胜率概念很熟悉。这一概念最初由美国职业棒球大联盟(MLB)的比尔·詹姆斯(Bill James)开发,目标是将团队的成功归功于个别球员。

利用迪安-奥利弗在《纸上篮球》(2004年)中阐述的一些想法,“篮球参考”栏目的贾斯汀·库巴特科创造了一个适用于NBA的评估版本。

这是一个有趣的测算方法,因为它给出了一个分数,可以 准确地估计一名球员为球队的战绩贡献了多少场胜利,毕竟,赢得胜利是球队管理层的最终目标。

根据本•泰勒(Ben Taylor)对尼龙微积分的回溯测试结果,Win share也会产生特别不稳定的结果。

调查显示:在参与我们调查的29名个人中,有14人回答说,他们不相信Win Shares per 48 minutes是一个有效的综合指标。只有一个参与者说Win Shares是他们首选的全面统计数据,但奇怪的是,这个人实际上是填写我们调查问卷的人中在NBA球队排名最高的人。

12.PIE



全称:Player Impact Estimate

指标类型:技术统计(不是估计球员正负值)

开发人员:NBA

数据:NBA.com

最新领袖:乔尔-恩比德,尼古拉-约基奇,字母哥,勒布朗-詹姆斯,吉米-巴特勒

与PER一样,PIE是一个一体化的衡量指标,但这个指标实际上是由联盟创建的。

对于这一指标, 当你将每个球员的分数相加时,结果等于100。从本质上来说,它的目的是回答每个球员在比赛中做出了多少比例的贡献。

与PER的公式相比,PIE的公式也是为了给防守增加更多的价值,个体也能容易计算出结果。 因为其在防守上的价值,PIE是少数几个显示恩比德得分比约基奇得分更高的高阶数据之一。

调查显示:在参与调查的29人中,有20人表示他们不相信球员影响评估(PIE)是一个有效的综合指标。没有人说PIE是他们喜欢的一体化统计数据。

13. PER(球员效率等级)



全称:球员效率等级(PlayerEfficiency Rating)

指标类型:技术统计(不估计球员正负值)

开发人员:约翰·霍林格(JohnHollinger)

数据:ESPN.com

最新领袖:尼古拉·约基奇,乔尔·恩比德,扬尼斯·阿德托昆博,锡安·威廉姆森,吉米·巴特勒

球员效率评价(PER)是JohnHollinger创造的一个一体化指标。 早在2007年,他就为espn网站引入了这一统计数据,不过他在更早期就开始使用这一指标。

霍林格创造了一个独特的节奏调整,每分钟的球员生产力评级,它有一个能在全领域领先的效率方案。PER不仅有一个突出的位置,而且很容易解释。PER的联盟平均得分总是15.0,而PER使得比较一个人每场比赛的得分变得容易理解和可扩展。

总的来说, PER的引入是一个巨大的进步,它欢迎更先进的分析进入主流,即使是普通的球迷也经常引用它。

霍林格本人就是一名开拓者,他在篮球方面有着很长的职业生涯——他曾任职于孟菲斯灰熊的管理层,现在是《TheAthletic》的一名作家。

尽管这个数据有它的缺点,PER还是代表了篮球分析史上一个重要的里程碑。此外,由于PER的局限性被广泛引用,盲点也很容易理解。

“我没有把PER列为我信任的指标,”一位目前在东部某支球队担任数据分析的高管告诉HoopsHype,“但它无处不在,很容易理解它是什么,不是什么。这使得它作为一个快速而粗略的概要统计数据非常有用。”



调查显示:在29名参与调查的人中,22人表示他们不相信PER(球员效率评级)是一个有效的综合指标。回答问题的参与者中没有一个人说PER是他们首选的概要统计数据。
ʕ•ᴥ•ʔ-avatar

ʕ•ᴥ•ʔ

顺便说一下 ,这些高阶数据里我个人比较喜欢的是EPM 可以把个人表现和比赛影响力结合在一起体现出来 [url]https://dunksandthrees.com/epm[/url]

和比赛观感最符合也能很好的解释论坛里常争吵的科比高阶数据不行疑问
查高阶数据要花钱 所以我就贴一个张公子在知乎的回答吧。

PER这玩意,是很早就过时了。这是个纯粹的数据栏套路,好处是简洁明了一望而知,坏处是不体现防守,也不太体现影响力。比如2005-06季,即纳什常规赛连庄那年,常规赛MVP纳什的PER是23.3,而马里昂是23.6。您去问太阳球迷:马里昂比纳什重要吗?太阳球迷能跟你拼了。

然后,PIE这个数据,是NBA自己搞的。好处是比PER稍微重视了点防守,坏处是依然不体现影响力。比如今年季后赛勇士的PIE,库里第一不提,下面佩顿第二,卢尼第三,普尔第四,库明加第五,维金斯、克雷和追梦分列六七八……——勇士球迷一定看出问题了吧?哪位会说季后赛样本小,行:常规赛勇士PIE第二是波特,呃……

然后,WS/48最初是用来搞棒球的,但这数据模拟成果不太稳定。

比如1995年冠军火箭,众所周知是大梦的球队。大梦场均33分10篮板5助攻3封盖。滑翔机场均21分7篮板5助攻。

结果大梦的季后赛ws/48,居然还不如滑翔机……


然后,Realgm做过个fic数据。好处也是数据填满,坏处是不体现影响力。不提。然后,82games的simple rating,主要是涉及到了+/-,但不太考虑同队因素。比如,这个数据模型说,本季灰熊的克拉克不止冠绝灰熊,而且表现好过戈贝尔、勒布朗、阿德巴约、东契奇……我估计灰熊球迷自己都不答应吧?

然后是ESPN的RPM,是涉及到了影响力与数据的。我个人认为,这是当下比较不错的。
上季常规赛rpm前五:约基奇、恩比德、库里、塔图姆、扬尼斯
上上季:库里、勒布朗、戈贝尔、乔治、扬尼斯、约基奇
上上上季:扬尼斯、勒布朗、哈登、约基奇、保罗。看着还算有说服力哈?但这玩意也有走偏的时候:不太考虑球员角色。比如2007-08季,保罗老四,勒布朗老三,KG老二,到此都还有得商量——吉诺比利第一。作为马刺球迷,您跟我说某一年吉诺比利是天下第一……那我是不敢信的。

然后是BPM,算是流行过,但也有问题。其一是这玩意防守判定问题很大,其二过于重视篮板球,其三嘛……举个荒诞的例子:2008年,也就是火箭22连胜那年,姚明55场场均22分11篮板2助攻2封盖。麦蒂66场场均22分5篮板6助攻。射手诺瓦克——谁还记得这位?——35场场均8分钟4分1篮板。结果论BPM:麦蒂2.9,姚明3.4——都不如诺瓦克4.2。所以那些年火箭真扫地僧诺瓦克,比姚麦还厉害?我怎么不信呢!接下来,是球探们会相对觉得靠谱的东西了。

RAPM是相对考量+/-的,侧重于影响力。Hoopshype问了29个球队的球探,有15个人说他们相信rapm。

上季常规赛,论RAPM,塔图姆第一,库里第二,约基奇第三,恩比德第四,霍勒迪第五,加兰德第六……但这个玩意也有缺点:依然不太考虑球员的角色,而且需要大样本才行。

那咱们来个大样本。2002-2011这十年的RAPM,勒布朗第一,KG次之,韦德第三,吉诺比利第四,科比第五——保罗第六,邓肯第七,纳什第八,德克第九,巴朗第十。看着是不是还算靠谱?

值得一提的是,虽然韦德和吉诺比利在科比之前,但那十年间他俩的样本远小于科比。不提吉诺比利是第六人了,科比那十年29783分钟的时间,韦德20540分钟。是不是这么一看,2002-2011这十年间,科比的高阶数据也不太惨淡了?



然后是538的raptors,这玩意相当受欢迎,只是需要大样本。再就是bball-index的lebron,也就是原来的pipm。这两个当然不完美,但是当下相对受欢迎的数据模型了。

再接着,是相对受欢迎的epm。

2019年,29个球探里有6个说这是他们的首选数据指标。这玩意好在是个人表现和综合影响力一起讨论的,我们来看看。

上季常规赛的epm——只看出场比赛人的表现水准的:约基奇、恩比德、扬尼斯、库里、杜兰特、勒布朗、欧文、塔图姆、霍勒迪、戈贝尔、杨、保罗。似乎还算靠谱?

上上季的epm:约基奇、恩比德、莱纳德、戈贝尔、库里、吉米、勒布朗、利拉德、扬尼斯。也还好?

2020年:扬尼斯、哈登、莱纳德、唐斯、勒布朗、祖巴茨、戈贝尔、戴维斯、约基奇。

2019年:哈登、库里、乔治、扬尼斯、戴维斯、恩比德、约基奇……

2018年:哈登、库里、戴维斯、保罗、利拉德、勒布朗……

2017年:保罗、库里、莱纳德、戈贝尔、威少、洛瑞、勒布朗、哈登……

2016年:库里、保罗、莱纳德、勒布朗、威少、追梦、洛瑞、杜兰特……

2015年:库里、保罗、莱纳德、戴维斯、勒布朗、哈登……

在这个epm下,勒布朗在2009-2013,都是NBA第一人。库里2015和2016的能力,哈登2018和2019的巅峰期,过去两年的约基奇,能耐都体现了。

那么epm体系下,科比的表现呢?

2004,科比进攻压倒联盟92%的人,整体压倒联盟94%的人,胜利贡献压倒联盟97%的人。

2006年即他得分王、单场81分、三节62分赛季,进攻第一,整体压倒联盟99%的人。

2007,进攻压倒99%,整体表现压倒联盟99%。

2008,98%、98%、99%。2009,99%、98%、99%。

2010,97%、96%、97%。

好像还凑合吧?大概,在越古早的数据模型里——即只考虑数据框的模型——对科比相对越不友好。越是考虑到影响力和对球队重要性的新模型,科比表现就还不错。当然,哪怕是对科比不太友好的ws之类数据,一旦在超巨大的样本之下,也是另一回事。比如论WS,常规赛+季后赛,科比历史第13。论vorp,科比历史第11。哪怕是对他不太友好的数据模型,样本够了的话,结果还是历史前列的,谈不到惨淡。当然咯,如开头所述:没有一揽子完美的数据模型。每个数据模型都有其侧重,所以综合起来看,选择相对靠谱的、更近的数据模型,会好一些。最后:还是要多看球赛本身啊!



作者:张佳玮
链接:[url]https://www.zhihu.com/question/442276628/answer/2566362465[/url]
ShdwWalker-avatar

ShdwWalker

众所周知防守端的高阶数据都不太行就不聊了,lebron告诉我进攻端吹杨强于库里字母哥东契奇仅次于约基奇这个谁来解释下
hat-avatar

hat

这东西能随便改,伪科学