gluonts.dataset.repository.datasets 模块#
- gluonts.dataset.repository.datasets.get_dataset(dataset_name: str, path: pathlib.Path = PosixPath('/home/runner/.gluonts/datasets'), regenerate: bool = False, dataset_writer: gluonts.dataset.DatasetWriter = JsonLinesWriter(use_gzip=True, suffix='.json', compresslevel=4), prediction_length: Optional[int] = None) gluonts.dataset.common.TrainDatasets [source]#
获取一个仓库数据集。
通过此函数可获取的数据集曾被多篇论文(例如,[SFG17]、[LCY+18] 和 [YRD15])使用过不同处理方法,或者通过 Monash 时间序列预测仓库获取。
- 参数
dataset_name – 数据集的名称,例如“m4_hourly”。
regenerate – 是否重新生成数据集,即使存在本地文件。如果此标志为 False 且文件存在,则不会再次下载数据集。
path – 数据集应保存的位置。
prediction_length – 数据集使用的预测长度。如果为 None,将使用默认预测长度。如果数据集已具体化,则将此选项设置为不同值无效。在这种情况下,请确保设置 regenerate=True。请注意,Monash 时间序列预测仓库中的某些数据集实际上没有默认预测长度 - 默认长度取决于数据的频率: - 分钟数据 –> 预测长度为 60(一小时) - 小时数据 –> 预测长度为 48(两天) - 日数据 –> 预测长度为 30(一个月) - 周数据 –> 预测长度为 8(两个月) - 月数据 –> 预测长度为 12(一年) - 年数据 –> 预测长度为 4(四年)
- 返回类型
通过下载或从本地文件重新加载获得的数据集。
- gluonts.dataset.repository.datasets.get_download_path() pathlib.Path [source]#
- 返回
gluon-ts 数据集或模型的默认下载路径。路径为 $HOME/.gluonts/
- 返回类型
路径
- gluonts.dataset.repository.datasets.materialize_dataset(dataset_name: str, path: pathlib.Path = PosixPath('/home/runner/.gluonts/datasets'), regenerate: bool = False, dataset_writer: gluonts.dataset.DatasetWriter = JsonLinesWriter(use_gzip=True, suffix='.json', compresslevel=4), prediction_length: Optional[int] = None) pathlib.Path [source]#
确保数据集具体化到 path / dataset_name 路径下。
- 参数
dataset_name – 数据集的名称,例如“m4_hourly”。
regenerate – 是否重新生成数据集,即使存在本地文件。如果此标志为 False 且文件存在,则不会再次下载数据集。
path – 数据集应保存的位置。
prediction_length – 数据集使用的预测长度。如果为 None,将使用默认预测长度。并非所有数据集都提供预测长度。
- 返回类型
数据集具体化所在的路径