Bake off redux: a review and experimental evaluation of recent time
series classification algorithms
解决问题:本文旨在重新审视之前关于时间序列分类算法的“烘焙赛”研究,评估新的算法是否能够超越之前的最佳算法,并对近期提出的算法进行分类和评估。本文的目标是为时间序列分类领域提供最佳算法的更新和发展。
关键思路:本文对之前研究提出的五种算法类型进行了扩展,加入了三种新的算法类型,包括卷积和特征算法以及深度学习方法。作者们使用UCR数据集,评估了各种算法的性能,并发现Hydra+MultiROCKET和HIVE-COTEv2两种算法在当前和新的TSC问题上表现显著优于其他方法。
其他亮点:本文提供了可重现性的结果和代码,为时间序列分类领域的发展提供了重要的参考。作者通过引入30个分类数据集,进一步评估了每个类别中表现最佳的算法。本文的贡献在于对时间序列分类算法的全面评估和分类,为该领域的研究提供了重要的参考和方向。
关于作者:Matthew Middlehurst、Patrick Schäfer和Anthony Bagnall是本文的主要作者。他们分别来自英国伦敦大学学院、卢卡尔森大学和斯旺西大学。Matthew Middlehurst之前的代表作包括“Time Series Classification with HIVE-COTE: The Hierarchical Vote Collective of Transformation-Based Ensembles”;Patrick Schäfer之前的代表作包括“On the Impact of Individual Time Series Normalization Decisions on Classification”;Anthony Bagnall之前的代表作包括“Time-series classification with COTE: the Collective of Transformation-based Ensembles”。
相关研究:其他近期的时间序列分类算法研究包括:“A review of shapelet applications in time series data mining”(作者:Yue Zhao等,机构:澳大利亚昆士兰科技大学);“Toward a Robust Deep Architecture for Time Series Classification”(作者:Sohrab Ferdowsi等,机构:伊朗伊斯兰共和国科学与工业研究组织);“Time series classification with ensembles of elastic distance measures”(作者:Gilles Vandewiele等,机构:比利时根特大学)。
论文摘要:这篇文章回顾了2017年的一篇研究论文,该论文对来自加州大学河滨分校(UCR)档案馆的85个数据集上的18个时间序列分类(TSC)算法进行了比较。这项研究通常被称为“烘焙比赛”,发现只有九种算法的表现明显优于使用的动态时间规整(DTW)和旋转森林基准。该研究通过对从时间序列数据中提取的特征类型对算法进行分类,形成了五种主要算法类型的分类法。该分类法以及为了可重复性而提供的代码和可访问的结果,促进了TSC领域的普及。自此次比赛以来已经过去了六年,UCR档案馆已扩展到112个数据集,并出现了大量新算法。文章重新审视了比赛,看看每个提出的类别自原始出版以来如何发展,并使用扩展的UCR档案馆评估了新算法相对于以前最佳类别的表现。他们扩展了分类法,包括三个新类别,以反映最近的发展。除了最初提出的基于距离、间隔、形状、字典和混合的算法外,他们还比较了新的卷积和基于特征的算法以及深度学习方法。作者介绍了30个分类数据集,这些数据集要么是最近捐赠给档案馆的,要么是按照TSC格式重新格式化的,并使用这些数据集进一步评估了每个类别的最佳表现算法。总的来说,他们发现最近提出的两种算法Hydra+MultiROCKET和HIVE-COTEv2在当前和新的TSC问题上的表现都明显优于其他方法。