gluonts.dataset.multivariate_grouper 模块#

class gluonts.dataset.multivariate_grouper.MultivariateGrouper(max_target_dim: typing.Optional[int] = None, num_test_dates: typing.Optional[int] = None, train_fill_rule: typing.Callable = <function mean>, test_fill_rule: typing.Callable = <function MultivariateGrouper.<lambda>>)[source]#

基类: object

MultivariateGrouper 接受一个单变量数据集并将其分组为一个多变量时间序列。因此，此类允许用户将单变量数据集转换为多变量数据集，而无需创建数据集的单独副本。

Multivariate Grouper 有两种不同的模式

训练模式: 对于训练数据，单变量时间序列会与数据集中的最早时间戳对齐。时间序列会进行左右填充，以生成形状为 (dim, num_time_steps) 的数组。

测试模式: 测试数据集可能包含多个起始日期（通常是因为测试数据集模拟了滚动评估场景）。在这种情况下，单变量数据集将被分割成 n 个多变量时间序列，其中 n 是评估日期的数量。同样，时间序列将被分组，但只进行左填充。请注意，如果上下文长度大于时间序列的长度，填充值会影响预测结果。

用户可以为训练数据集和测试数据集指定填充规则。

参数

max_target_dim – 设置最大维度（用于更快地测试或当遇到多变量模型的限制时）。选取最后 max_target_dim 个时间序列并将它们分组为多变量时间序列。
num_test_dates – 测试集中的测试日期数量。如果测试集包含多个预测起始日期（通常在滚动评估场景中），则此值可能大于一。必须设置此参数才能转换测试数据。
train_fill_rule – 实现对训练数据集时间序列对齐后填充缺失数据的规则。
test_fill_rule – 实现对测试数据集时间序列对齐后填充缺失数据的规则。

static to_ts(data: Dict[str, Any]) → pandas.core.series.Series[source]#