gluonts.dataset.multivariate_grouper 模块#
- class gluonts.dataset.multivariate_grouper.MultivariateGrouper(max_target_dim: typing.Optional[int] = None, num_test_dates: typing.Optional[int] = None, train_fill_rule: typing.Callable = <function mean>, test_fill_rule: typing.Callable = <function MultivariateGrouper.<lambda>>)[source]#
基类:
object
MultivariateGrouper 接受一个单变量数据集并将其分组为一个多变量时间序列。因此,此类允许用户将单变量数据集转换为多变量数据集,而无需创建数据集的单独副本。
Multivariate Grouper 有两种不同的模式
训练模式: 对于训练数据,单变量时间序列会与数据集中的最早时间戳对齐。时间序列会进行左右填充,以生成形状为 (dim, num_time_steps) 的数组。
测试模式: 测试数据集可能包含多个起始日期(通常是因为测试数据集模拟了滚动评估场景)。在这种情况下,单变量数据集将被分割成 n 个多变量时间序列,其中 n 是评估日期的数量。同样,时间序列将被分组,但只进行左填充。请注意,如果上下文长度大于时间序列的长度,填充值会影响预测结果。
用户可以为训练数据集和测试数据集指定填充规则。
- 参数
max_target_dim – 设置最大维度(用于更快地测试或当遇到多变量模型的限制时)。选取最后 max_target_dim 个时间序列并将它们分组为多变量时间序列。
num_test_dates – 测试集中的测试日期数量。如果测试集包含多个预测起始日期(通常在滚动评估场景中),则此值可能大于一。必须设置此参数才能转换测试数据。
train_fill_rule – 实现对训练数据集时间序列对齐后填充缺失数据的规则。
test_fill_rule – 实现对测试数据集时间序列对齐后填充缺失数据的规则。