C刊热文基于分位数回归模型的高水平篮球比

导语

很荣幸能够在此平台上介绍我发表在《体育学刊》年第1期的文章《基于分位数回归模型的高水平篮球比赛制胜因素探析—以FIBA男子篮球世界杯为例》,希望通过此文章的交流得到更多学者的批评和指正,让自己能从更宽广的视角去思考问题,在自己的学术道路上不断学习和取得进步——张绍良。

1

研究缘起

我在读博士期间曾经在西班牙甲级联赛的皇家马德里篮球俱乐部实习过半年,那是在我导师AlbertoLorenzo的引荐下去跟随皇马的体能训练师JuanTrapero在一起学习,那时跟我在一起的还有EnriqueAlonso主要为球队做视频剪辑分析还有数据可视化分析,在一个赛季结束后我们常常要做一个赛季的总结报告,个人和团队运动表现两个维度的报告。对我来说,团队的视频剪辑标注和清理整合数据可能是这个世界上最辛苦的工作,但是现在回想成了最难忘的回忆。那时我们在累的时候常去基地的咖啡厅里坐下来闲聊,有次Juan问我和Enrique一个问题,我们球队本赛季在不同的比赛节奏节奏下运动表现如何?我和Enrique回到屋子拿到球队整个赛季对阵不同对手的数据进行整理和分析,我记得我们最初的想法就是用聚类分成若干不同节奏的群组,然后将群组之间用判别分析法去分析不同节奏下的比赛表现差异,那时我数据挖掘和统计学的基础,只允许我做个简单的模型去探索分析,但似乎得到的反馈仍然是不理想,得不到教练的认可,实际上在西甲的篮球界不相信数据分析的教练还是占大多数的,但是那时我和Enrique仍然没有放弃,后来我们也试过很多的统计模型,都没有得到团队的认可,因为教练只想得到再更加细分的比赛节奏下,哪些技战术指标更为关键,我们的统计学模型是无法与教练的想法结合在一起的,换句话说,我们做的是我们做的,但可不是教练想要的,但那时迫于没有好的统计模型,只能从原始的数据进行一些简单的描述分析去说明我的想法,但是教练组仍然觉得这么大的样本量,我们应该进行数据挖掘,从这些数据中挖掘出来一些有意义的东西,而不是停留在原始数据简单的描述比较分析,因为简单的几场比赛描述不能代表整个赛季球队的整体表现。因此,后期我一直在寻找一种新的模型去说服教练,发自内心的想告诉教练我们不仅仅剪辑的视频可以帮助球队,数据分析也能看到很多能够帮助球队的东西,让他们知道我们更多的价值,后来我博士要准备答辩和最后定稿的博士论文我只能提前离队,但是这个问题一直在我内心留存。

2

研究准备与展开

在回国以后有一天晚上,我在Researchgate网站上发了一个帖子,问了发生在我身上的这个故事所产生的疑惑,后来得到了来自全球各地学者的解读,这里我最感谢的应该是来自英国纽曼大学的TonyD,我们后来互相发了很多的邮件,他给我提供了很多的帮助,因为我们那个时候很神奇的在思考一样的问题,他的困惑是关于游泳而我是篮球,只是竞技项目不同,但是问题的本质相同,我们一起搜索了很久,最后决定应用分位数回归的方法在竞技体育领域做一个尝试。很高兴他的文章《Discerningexcellencefrommediocrityinswimming:NewinsightsusingBayesianquantileregression》上个月也发表在《EuropeanJournalofSportScience》,这个算法不是什么新开发的算法,在很多领域已经得到了广泛的应用,但是我们俩可以说第一次将这个方法用在竞技体育领域中。在我们应用这个模型前,条件均值模型被广泛的应用于体育科学实证研究中,尤其在过去的半个世纪里,使用最小二乘法及其衍化方法对连续型因变量与自变量的关系进行回归建模被认为是现代体育科学重要的统计工具,一元和多元线性回归,二分类因变量的logistic和probit模型以及分析计数因变量的泊松回归模型在体育科学实证研究中的地位不断提高,但是这些方法都没有超出条件均值模型的框架,这个框架在体育科学实证研究中也很少被质疑。然而,分位数回归(它最早由Koenker和Bassett()提出的)是估计一组回归变量X与被解释变量Y的分位数之间线性关系的建模方法。传统回归模型是研究被解释变量的条件期望(均值)与每个自变量X的关系,它的计算是基于最小化残差平方,而分位数回归估计量的计算是基于一种非对称形式的绝对值残差最小化,能够更加全面的描述被解释变量条件分布的全貌,分析解释变量如何影响被解释变量的中位数、不同分位数等,而不是仅仅分析被解释变量的条件期望(均值)。此外,分位数回归的估计方法与传统线性模型中的最小二乘法相比,估计结果对离群值则表现的更加稳健,而且,分位数回归对误差项并不要求很强的假设条件,因此对于非正态分布的而言,分位数回归系数估计量则更加稳健。可见,这个模型可以解决很多在体育科学实证中的难题,比如在团体项目不同比赛节奏下,不同分差下,不同控球率影响下球员和球队的表现,通过这个模型可以很好的解决实践过程中教练员所提出的问题。

年西班牙男篮获得了篮球世界杯的冠军,因此我们决定将这个方法用在本次男子篮球世界杯评估报告中,评估不同胜率等级球队的技战术特点,我的朋友董芮,王星,张铭鑫和我师兄崔一雄收集了年男篮世界杯的数据,我们开始了新的探索和统计分析。通过这个研究我们确实发现,分位数回归更加适合和贴近教练员的真实所需。对很多问题可以进行更加深刻细致的回答,是传统线性模型没有办法做到的。

3

研究反思与展望

在我留学期间的这个故事,我曾经一直以为我的故事就是学术与实践不能相结合的典型案列,现在回想起来,实际上很多时候,只是我们体育科学研究者有限的研究能力和方法限制住了自己,并不能很好解决教练员所提出的问题。如果体育科研工作者不断学习和借鉴新的东西,多与教练员沟通交流,从教练员的角度去思考和解决问题,实际上就会能够把体育科研的成果很好的应用在实践中。因此,从我的个人经历我觉得好的体育科研工作者应做到以下三点:第一,要站在一线,和教练多沟通思考,所产生的科学疑问恰恰也是教练员最想解决的难题,不要只是自己喜欢什么去做什么,要学会用教练员的思维去发现问题。第二,不断持续的学习新的算法和知识,可能就像我自己的故事,教练给我了自己的问题,自己有限的能力觉得是学术与实践之间的鸿沟,学术的知识无法用于实践,实际上早就有新的可以应用的算法可以解决教练的难题,只是自己不知道,在球队教练几乎没有时间学习数据和体育科技的东西,因此科研工作者就要做好这个桥梁工作,把教练的想法和思维与现在体育科技所获得的数据和有效的算法连接起来,让体育科研在实践中更好的应用。第三,我们需要借助交叉学科的力量,自己能力的有限性是必须深刻认识到的,要广泛的咨询问题的解决方案,找不同学科的专家一起攻破教练的难题,这是体育科研未来发展的必然之路。希望分位数回归模型可以在竞技体育里得到更广泛的认可和应用,很多观点只是我现阶段的想法,欢迎更多的专家读者可以与我沟通交流,持续学习才是不断取得进步的基石。最后,还是要感谢下《体育学刊》能够接收我的文章,实际上这是我留学回国以后以第一作者身份在国内发表的首篇文章,难忘的回忆,希望未来有更多的科研成果可以发表在这个学刊上与各位专家学者交流,再次感谢!

预览时标签不可点收录于话题#个上一篇下一篇



转载请注明地址:http://www.shanghaibinbei.com/kftd/10969.html
  • 上一篇文章:
  • 下一篇文章: 没有了
  • 热点文章

    • 没有热点文章

    推荐文章

    • 没有推荐文章