gluonts.torch.model.i_transformer.estimator 模块#

class gluonts.torch.model.i_transformer.estimator.ITransformerEstimator(prediction_length: int, context_length: Optional[int] = None, d_model: int = 32, nhead: int = 4, dim_feedforward: int = 128, dropout: float = 0.1, activation: str = 'relu', norm_first: bool = False, num_encoder_layers: int = 2, lr: float = 0.001, weight_decay: float = 1e-08, scaling: Optional[str] = 'mean', distr_output: gluonts.torch.distributions.output.Output = gluonts.torch.distributions.studentT.StudentTOutput(beta=0.0), num_parallel_samples: int = 100, batch_size: int = 32, num_batches_per_epoch: int =50, trainer_kwargs: Optional[Dict[str, Any]] = None, train_sampler: Optional[gluonts.transform.sampler.InstanceSampler] = None, validation_sampler: Optional[gluonts.transform.sampler.InstanceSampler] = None, nonnegative_pred_samples: bool = False)[source]#

基类: gluonts.torch.model.estimator.PyTorchLightningEstimator

一个训练 iTransformer 模型用于多元预测的估计器，如 https://arxiv.org/abs/2310.06625 中所述，并扩展为概率模型。

此类使用 ITransformerModel 中定义的模型，并将其封装到 ITransformerLightningModule 中用于训练目的：训练是使用 PyTorch Lightning 的 pl.Trainer 类进行的。

参数

prediction_length (int) – 预测范围的长度。
context_length – 模型作为输入的时间步数，位于预测时间之前（默认值：10 * prediction_length）。
d_model – Transformer 编码器中的潜在空间大小。
nhead – Transformer 编码器中注意力头的数量，必须能够整除 d_model。
dim_feedforward – Transformer 编码器中隐藏层的大小。
dropout – Transformer 编码器中的 dropout 概率。
activation – Transformer 编码器中的激活函数。
norm_first – 是否在注意力机制之前或之后应用归一化。
num_encoder_layers – Transformer 编码器中的层数。
lr – 学习率（默认值：1e-3）。
weight_decay – 权重衰减正则化参数（默认值：1e-8）。
scaling – 缩放参数可以是 “mean”, “std” 或 None。
distr_output – 用于评估观测值和样本预测的分布（默认值：StudentTOutput()）。
num_parallel_samples – 最终预测器应为每个时间序列生成的样本数量（默认值：100）。
batch_size – 用于训练的批次大小（默认值：32）。
num_batches_per_epoch –

每个训练 epoch 中要处理的批次数量
（默认值：50）。
trainer_kwargs – 提供给 pl.Trainer 的额外构建参数。
train_sampler – 控制训练期间窗口的采样。
validation_sampler – 控制验证期间窗口的采样。
nonnegative_pred_samples – 最终预测样本是否应为非负数？如果是，将应用激活函数以确保非负。请注意，这仅应用于最终样本，在训练期间不应用。

create_lightning_module() → lightning.pytorch.core.module.LightningModule[source]#

创建并返回用于训练（即计算损失）的网络。

返回值: 根据输入数据计算损失的网络。
返回值类型: pl.LightningModule

create_predictor(transformation: gluonts.transform._base.Transformation, module) → gluonts.torch.model.predictor.PyTorchPredictor[source]#

创建并返回一个预测器对象。

参数

transformation – 应用于进入模型之前的数据的转换。
module – 一个已训练的 pl.LightningModule 对象。

返回值

一个封装 nn.Module 用于推理的预测器。

返回值类型

预测器

create_training_data_loader(data: gluonts.dataset.Dataset, module: gluonts.torch.model.i_transformer.lightning_module.ITransformerLightningModule, shuffle_buffer_length: Optional[int] = None, **kwargs) → Iterable[source]#

创建一个用于训练的数据加载器。

参数

data – 用于创建数据加载器的数据集。
module – 将接收数据加载器批次的 pl.LightningModule 对象。

返回值

数据加载器，即数据批次的迭代器。

返回值类型

Iterable

create_transformation() → gluonts.transform._base.Transformation[source]#

创建并返回训练和推理所需的转换。

返回值: 在训练和推理时逐条应用于数据集的转换。
返回值类型: Transformation

create_validation_data_loader(data: gluonts.dataset.Dataset, module: gluonts.torch.model.i_transformer.lightning_module.ITransformerLightningModule, **kwargs) → Iterable[source]#

创建一个用于验证的数据加载器。

参数

data – 用于创建数据加载器的数据集。
module – 将接收数据加载器批次的 pl.LightningModule 对象。

返回值

数据加载器，即数据批次的迭代器。

返回值类型

Iterable

lead_time: int#

prediction_length: int#