• 传统统计
    在时间序列预测方面,传统的统计方法往往优于机器学习方法 文/ Paul Cuckoo 今天,如果没有基于机器学习(ML)的解决方案,坐在分析环境中的会议上讨论解决问题的方法是不可能的。这是有道理的;从SVM、CART回归树到神经网络套件(BNN、RNN、LSTM)的ML技术提供了优越的预测能力。当将这种预测能力转换为时间序列预测时,自然会认为这些ML算法应该是首选。好吧,也许不是。雅典国立技术大学的3位预测专家最近发表的一篇论文可能会给出相反的建议; 就时间序列预测而言,ARIMA或ETS等传统统计技术实际上可能提供更好的预测性能。 研究小组利用来自已知数据源M3竞赛数据的1045个时间序列数据子集,测量了8种传统统计技术和8种先进的ML技术的预测性能。他们研究的主要结果,以及艾哈迈德等人早期的研究,如下图所示,其中sMAPE%用作误差指标(越低越好): 统计和ML方法的性能之间有明显的区别。然而,作者进一步考虑了这些方法的计算复杂度。通常,许多统计方法都可以在标准笔记本上几秒钟内运行。相比之下,一些神经网络需要在快速gpu上训练数小时。考虑到这一点,计算复杂度的扩展显示如以下图表: 正如现在所预期的,有一整套统计技术(Holt-Winters, SES等),它们在计算上都非常简单,并且性能良好。作者继续写道: “学术的ML预测文献存在的一个问题是,大多数已发表的研究提供了预测,并声称其准确性令人满意,而没有将它们与简单的统计方法甚至朴素的基准进行比较。这样做提高了ML方法提供准确预测的期望,但没有任何实证证据证明这是事实。” 他们的工作清楚地强调了ML方法更好这一错误假设。这也不需要考虑ML方法减少的可解释性和不确定性管理。正如一位同事最近所言,复杂性不一定是创新。 在OMD EMEA的市场情报部门,我们每天处理各种数据类型和结构,尤其是时间序列数据。尽管ML算法将继续成为我们在所有数据结构上提供的高级分析的基础,但本文的工作表明,传统的统计和计量经济学建模技术仍有很多可提供的,成本非常低。 (以上是我的个人观点,并不一定反映OMD EMEA或任何Omnicom公司的观点) 以上内容由HR Tech China AI翻译,仅供参考
    传统统计
    2018年07月16日