QUICK REVIEW
[论文解读] sktime: A Unified Interface for Machine Learning with Time Series
Markus Löning, Anthony Bagnall|arXiv (Cornell University)|Sep 17, 2019
Time Series Analysis and Forecasting参考文献 49被引用 176
一句话总结
sktime 引入一个与 scikit-learn 兼容的 Python 库,将时间序列任务统一在一个 API 下,通过元估计量和时间序列变换实现预测、分类和其他任务之间的归约。
ABSTRACT
We present sktime -- a new scikit-learn compatible Python library with a unified interface for machine learning with time series. Time series data gives rise to various distinct but closely related learning tasks, such as forecasting and time series classification, many of which can be solved by reducing them to related simpler tasks. We discuss the main rationale for creating a unified interface, including reduction, as well as the design of sktime's core API, supported by a clear overview of common time series tasks and reduction approaches.
研究动机与目标
- 促成创建一个统一 API,以处理多样的时间序列学习任务。
- 提供一个与 scikit-learn 兼容的核心 API,支持时间序列的归约、组合和模块化变换。
- 在一个框架内展示最前沿的时间序列分类、预测和基准工具。
提出的方法
- 通过降维到更简单任务的方式,描述时间序列任务及其关系。
- 提出一个数据模型和一个嵌套的、与 pandas 兼容的数据容器,以处理多变量、面板和时间异质数据。
- 定义针对时间序列用例的任务特定估计器和转换器,扩展 scikit-learn 接口。
- 引入用于归约和多变量集成的元估计量,以实现灵活的模型组合。
- 提供包括分类、预测、转换器、组合和基准工具在内的 API 概览。
实验结果
研究问题
- RQ1如何在保持与 scikit-learn 兼容的前提下,将时间序列任务统一到一个单一的 API?
- RQ2通过组合较简单的组件,降维和元估计量是否能实现对复杂时间序列任务的灵活求解?
- RQ3哪些数据表示和变换框架最能支持多变量、面板、时间异质的时间序列数据?
主要发现
- sktime 提供了一个统一的 API,扩展了 scikit-learn 的时间序列任务能力,使复杂任务到简单任务的归约成为可能。
- 它引入了一个嵌套/基于 pandas 的数据容器,以支持多变量、面板和时间异质数据,同时复用 scikit-learn 的功能。
- 该库包含前沿的时间序列分类方法、经典的预测接口、转换器和基准工具。
- 它具备如流水线、集成以及新颖的归约元估计量等组合能力,支持可配置的建模选择。
- sktime 支持多变量逐列集成和按列拼接时间序列数据,从而实现灵活的模型构建。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。