gluonts.dataset.common 模块#
- class gluonts.dataset.common.BasicFeatureInfo(*, name: str)[source]#
- 基类: - pydantic.v1.main.BaseModel- name: str#
 
- class gluonts.dataset.common.CategoricalFeatureInfo(*, name: str, cardinality: str)[source]#
- 基类: - pydantic.v1.main.BaseModel- cardinality: str#
 - name: str#
 
- gluonts.dataset.common.FileDataset(path: pathlib.Path, freq: str, one_dim_target: bool = True, cache: bool = False, use_timestamp: bool = False, loader_class=None, pattern='*', levels=2, translate=None, ignore_hidden=True) gluonts.dataset.Dataset[source]#
- gluonts.dataset.common.ListDataset(data_iter: gluonts.dataset.Dataset, freq: str, one_dim_target: bool = True, use_timestamp: bool = False, translate: Optional[dict] = None) List[Dict[str, Any]][source]#
- 直接由字典列表支持的数据集。 - 参数
- data_iter – 可迭代对象,生成数据集中的所有项目。每个项目都应是一个将字符串映射到值的字典。例如:{“start”: “2014-09-07”, “target”: [0.1, 0.2]}。 
- freq – 时间序列中观测值的频率。必须是有效的 Pandas 频率字符串。 
- one_dim_target – 是否只接受单变量目标时间序列。 
 
 
- class gluonts.dataset.common.MetaData(*, freq: str, target: Optional[gluonts.dataset.common.BasicFeatureInfo] = None, feat_static_cat: List[gluonts.dataset.common.CategoricalFeatureInfo] = [], feat_static_real: List[gluonts.dataset.common.BasicFeatureInfo] = [], feat_dynamic_real: List[gluonts.dataset.common.BasicFeatureInfo] = [], feat_dynamic_cat: List[gluonts.dataset.common.CategoricalFeatureInfo] = [], prediction_length: Optional[int] = None)[source]#
- 基类: - pydantic.v1.main.BaseModel- class Config[source]#
- 基类: - pydantic.v1.config.BaseConfig- allow_population_by_field_name: bool = True#
 
 - feat_dynamic_cat: List[gluonts.dataset.common.CategoricalFeatureInfo]#
 - feat_dynamic_real: List[gluonts.dataset.common.BasicFeatureInfo]#
 - feat_static_cat: List[gluonts.dataset.common.CategoricalFeatureInfo]#
 - feat_static_real: List[gluonts.dataset.common.BasicFeatureInfo]#
 - freq: str#
 - prediction_length: Optional[int]#
 - target: Optional[gluonts.dataset.common.BasicFeatureInfo]#
 
- class gluonts.dataset.common.ProcessDataEntry(freq: str, one_dim_target: bool = True, use_timestamp: bool = False)[source]#
- 基类: - object
- class gluonts.dataset.common.ProcessStartField(*, freq: Union[str, pandas._libs.tslibs.offsets.DateOffset], use_timestamp: bool = False, name: str = 'start')[source]#
- 基类: - pydantic.v1.main.BaseModel- 将 start 字段转换为具有给定频率的 Period 对象。 - 参数
- name (str) – 要转换的字段名称。 
- freq (Union[str, pandas._libs.tslibs.offsets.DateOffset]) – 要使用的频率。这必须是有效的 Pandas 频率字符串。 
 
 - freq: Union[str, pandas._libs.tslibs.offsets.DateOffset]#
 - name: str#
 - use_timestamp: bool#
 
- class gluonts.dataset.common.ProcessTimeSeriesField(name, is_required: bool, is_static: bool, is_cat: bool)[source]#
- 基类: - object- 将由 name 标识的时间序列字段从数字列表转换为 numpy 数组。 - 构造函数参数以以下方式修改转换逻辑 - 如果 is_required=True,则如果字段在 Data 字典中不存在,则会抛出 GluonTSDataError。 - 如果 is_cat=True,数组类型为 np.int32,否则为 np.float32。 - 如果 is_static=True,则断言结果数组是一维的,否则断言结果数组是二维的。形状为 (T) 的二维动态数组会自动扩展为形状 (1,T)。 - 参数
- name – 要处理的字段名称。 
- is_required – 字段是否必须存在。 
- is_cat – 字段是否指向分类(即整数)值。 
- is_static – 字段是否应该具有时间维度。 
 
 
- class gluonts.dataset.common.SourceContext(source, row)[source]#
- 基类: - tuple- row: int#
- 字段编号 1 的别名 
 - source: str#
- 字段编号 0 的别名 
 
- class gluonts.dataset.common.TrainDatasets(metadata: gluonts.dataset.common.MetaData, train: gluonts.dataset.Dataset, test: Optional[gluonts.dataset.Dataset] = None)[source]#
- 基类: - tuple- 包含两个子集的数据集,一个用于训练,另一个用于测试,并包含元数据。 - metadata: gluonts.dataset.common.MetaData#
- 字段编号 0 的别名 
 - save(path_str: str, writer: gluonts.dataset.DatasetWriter, overwrite=False) None#
- 将 TrainDatasets 对象保存到 JSON Lines 文件。 - 参数
- path_str – 数据集的保存路径。 
- overwrite – 是否删除此文件夹中的旧版本。 
 
 
 - test: Optional[gluonts.dataset.Dataset]#
- 字段编号 2 的别名 
 - train: gluonts.dataset.Dataset#
- 字段编号 1 的别名 
 
- gluonts.dataset.common.load_datasets(metadata: pathlib.Path, train: pathlib.Path, test: Optional[pathlib.Path], one_dim_target: bool = True, cache: bool = False) gluonts.dataset.common.TrainDatasets[source]#
- 根据元数据、训练集和测试集路径加载数据集。 - 参数
- metadata – 元数据文件的路径 
- train – 训练集文件的路径。 
- test – 测试集文件的路径。 
- one_dim_target – 是否将 FileDatasets 加载为单变量目标时间序列。 
- cache – 指示 FileDatasets 是否应该被缓存。 
 
- 返回值
- 一个包含元数据、训练数据、测试数据的对象。 
- 返回类型