gluonts.dataset.repository 包#

gluonts.dataset.repository.get_dataset(dataset_name: str, path: pathlib.Path = PosixPath('/home/runner/.gluonts/datasets'), regenerate: bool = False, dataset_writer: gluonts.dataset.DatasetWriter = JsonLinesWriter(use_gzip=True, suffix='.json', compresslevel=4), prediction_length: Optional[int] = None) gluonts.dataset.common.TrainDatasets[source]#

获取一个仓库数据集。

通过此函数获取的数据集在不同的论文中随着时间的推移被用于不同的处理(例如,[SFG17][LCY+18][YRD15]),或者通过 Monash 时间序列预测仓库获得。

参数
  • dataset_name – 数据集的名称,例如“m4_hourly”。

  • regenerate – 即使本地文件存在,是否重新生成数据集。如果此标志设置为 False 并且文件存在,则不会再次下载数据集。

  • path – 数据集应保存的位置。

  • prediction_length – 用于数据集的预测长度。如果为 None,则将使用默认预测长度。如果数据集已经具体化,则将此选项设置为其他值无效。在这种情况下,请确保设置 regenerate=True。请注意,Monash 时间序列预测仓库中的某些数据集实际上没有默认预测长度 - 默认长度取决于数据的频率:- 分钟数据 -> 预测长度为 60(一小时) - 小时数据 -> 预测长度为 48(两天) - 日数据 -> 预测长度为 30(一个月) - 周数据 -> 预测长度为 8(两个月) - 月数据 -> 预测长度为 12(一年) - 年数据 -> 预测长度为 4(四年)

返回类型

通过下载或从本地文件重新加载获得的数据集。

gluonts.dataset.repository.get_download_path() pathlib.Path[source]#
返回

gluon-ts 数据集或模型的默认下载路径。路径为 $HOME/.gluonts/

返回类型

路径