[水一帖] 高阶数据科普

Nonside-avatar

Nonside

2025-03-21T02:31:57+00:00

长总,当你讨论高阶数据时,不要再翻出什么PER,老BPM,WS,这些旧时代的垃圾高阶数据了

这些高阶数据怎么来的,那时候机器学习还不流行,就是把得分篮板命中率等等数据加权求和,而权重完全是砖家自己拍脑袋想的

举个最简单例子
老bpm
Raw BPM = a*ReMPG + b*ORB% + c*DRB% + d*STL% + e*BLK%+ f*AST% - g*USG%*TO% + h*USG%*(1-TO%)*[2*(TS% - TmTS%) + i*AST% + j*(3PAr -Lg3PAr) - k] + l*sqrt(AST%*TRB%)

看着复杂,其实就是你只要把数据栏填满,自然就高了,比如场均三双的威少,算出来历史第一人,打爆了bpm(后来bpm改了新算法,没有公布,新bpm含金量就不知道了)
per比bpm更菜,甚至不用填满数据栏,你只要某些数据高自然就高,什么马里昂算出来比纳什高


这些年机器学习技术进步,应用于篮球,产生了一些新的高阶数据,这些高阶数据不看你的篮板助攻盖帽等数据,直接拆解到攻守回合,看你能不能帮助球队得分和防守
比如现在比较好的epm,用的是贝叶斯先验的办法,只要你赢球,epm自然就高。

所以,不要再搞陈年老图,用垃圾的东西证明这东西是垃圾了。
Persephone-avatar

Persephone

以前詹姆斯霸榜的时候可不是这么说的啊,更早科比麦迪那会也不是这么说的啊
napbarra-avatar

napbarra

新时代高阶数据的最大问题是没法跨年代比较,90年代甚至10年代以前很多比赛没有pbp数据支持,斗不了蛐蛐。而且防守方面的数据依然不能很好的量化。
ffaizuki-avatar

ffaizuki

还是那句话
高阶强的人不一定强
真的强的人高阶一定不会弱
除了。
Nonside-avatar

Nonside

+ by [Vincecarter00015] (undefined)

以前詹姆斯霸榜的时候可不是这么说的啊,更早科比麦迪那会也不是这么说的啊

求求你们不要把每一个篮球论坛变成黑和粉pvp竞技场好吗?