Zirdle 研究
Zirdle 5
五个专为 AI 模型,从零开始使用 50 亿市场数据点训练。
每个模型都是一个专有构建的多变量 Transformer,专为特定交易环境设计——日内刷单、均值回归、动量波段、成长突破和保守指数跟踪。不是任何基础模型的微调版本。
5.3B
训练用K线柱
5
不同模型
4× A40
NVIDIA A40
0
基座微调次数
遇见五人组
H
样本外
+1.47%/周
HELIOS
5 分钟日内超短线交易,针对流动性大的大盘股
太阳神——永远在线,日周期,最快的阳光
4.4 M
参数
12
通道
5 min
间隔
阅读论文
E
样本外
+1.48%/周
ECHO
基於ETF和波動率產品的15分鐘均值回歸
山中仙女,聲響迴盪——價格回歸公允價值
3.3 M
参数
12
通道
15 min
间隔
阅读论文
O
样本外
+4.09%/周
ORION
24通道指標豐富的日動能擺盪策略
獵戶星座在天際劃過
14.5 M
参数
24
通道
1 day
间隔
阅读论文
N
样本外
+4.38%/周
NOVA
高貝塔成長股的深度專業化策略
爆发的恒星——突然的快速增长
34.1 M
参数
24
通道
1 day
间隔
阅读论文
A
样本外
+2.21%/周
ATLAS
仅适用于指数和大型股的OHLCV基线
承担世界的泰坦——稳定的基础
2.4 M
参数
5
通道
1 day
间隔
阅读论文
我们如何构建它们
Zirdle 五人组共享相同的架构家族,但在范围、输入通道和容量上有所不同。它们是从头开始训练的——而不是从任何开放权重的基座模型微调而来——因为金融时间序列需要领域特定的归纳偏好,而通用的预训练会破坏这些偏好。
因子化注意力
一种受 ViViT 启发的因子化变换器,首先在每个时间片内的输入通道上执行注意力机制,然后每个通道内跨时间片进行操作。在 24 个通道下,二次成本保持在可控范围内。
分位数损失
每个模型使用 pinball 损失函数预测 7 个分位数(0.05、0.10、0.25、0.50、0.75、0.90、0.95)——这是一种适用于概率预测的恰当评分规则。这种联合位置 + 不确定性训练对于风险感知分析至关重要。
状态感知训练窗口
每日模型训练于 2010–2022 年。期间刻意排除了十进制化前(2001 年)、高频交易前(≤2007 年)和全球金融危机时段(2007–2009 年)。在我们的参数预算下,旧机制的数据是噪声,会从当前市场结构中窃取容量。
训练设置
架构族因式化的通道 × 时间注意力
硬件4× NVIDIA A40(48 GB)
训练窗口2010-01-01 → 2022-12-31(日频机器人)/ 2022-06 → 2024-06(日内)
样本外测试2024-07-01 → 2025-11-30(15周样本外)含6个月统一全宇宙