学途智助
首页
分类
标签
关于网站
登录
eeettt123
2025-09-04
9
作者编辑
时间序列预测训练机制笔记
时间序列预测训练机制笔记 1️⃣ 样本构建与滑窗 常用滑窗构建输入序列: 例:[1,2,3,4,5] → 6,[2,3,4,5,6] → 7 滑窗重叠部分是特征共享,但每个样本都有自己的目标输出。 核心理解: 模型每个样本独立预测下一步。 下一个滑窗的目标不会直接“泄露”给前一个样本。 2️⃣ Batch 与梯度 Batch Size 的作用:每次梯度计算使用的样本数量。 小 Batch: 梯度敏感,能捕捉序列微小特征变化。 梯度噪声大,训练震荡明显。 大 Batch: 梯度平滑,训练稳定。 平均梯度可能掩盖微小变化。 3️⃣ 同一 batch 内的序列关系 即使滑窗重叠: [1,2,3,4,5] → 6 和 [2,3,4,5,6] → 7 在同一个 batch 内,也各自计算 loss。 batch 内的样本不会直接把自己的目标输出传给其他样本。 误解澄清: 并不是 batch 大就“能学到下一个时间步”,而是梯度的平均可能影响学习的精度。 4️⃣ 数据集划分注意事项 时间序列数据前后特征可能不同。 直接切分 train/val: 前 80% 作为训练集,后 20% 验证集。 可能导致验证集分布和训练集不同。 建议: 交叉验证或滚动验证(rolling window)。 避免时间泄露,但保持序列顺序。 5️⃣ 总结核心概念 滑窗样本是 overlapping 的,但每个样本独立计算损失。 Batch size 控制梯度平均与敏感度,而不是信息传递。 小 batch → 精细学习特征,训练震荡大;大 batch → 平滑稳定,但微特征可能丢失。 数据集划分要考虑序列的时间连续性和分布差异。
Python
赞
博客信息
作者
eeettt123
发布日期
2025-09-04
其他信息 : 其他三字母的人名首字母都是其他同学发布的哦