Zirdle Research
Zirdle 五模型
五个从零开始使用 50 亿市场数据点训练而成的专有 AI 模型
每个模型都是针对特定交易制度构建的多元变换器——日内抢帽子、均值回归、动量摆动、成长突破和保守指数跟踪。并非对任何基础模型的微调。
5.3B
训练K线数量
5
不同模型数
4× A40
NVIDIA A40
0
基础模型微调次数
与五人组会面
H
样本外
+1.47%/wk
HELIOS
5分钟日内短线交易于流动性大的大盘股
太阳神——始终开启,日循环,最快的光
4.4 M
params
12
channels
5 min
interval
阅读论文
E
样本外
+1.48%/wk
ECHO
ETF与波动率产品的15分钟均值回归
山间回音女神之声——价格回归公允价值
3.3 M
params
12
channels
15 min
interval
阅读论文
O
样本外
+4.09%/wk
ORION
24通道指标丰富的日线动量波动
追踪天际的猎户星座
14.5 M
params
24
channels
1 day
interval
阅读论文
N
样本外
+4.38%/wk
NOVA
高贝塔增长型股票的深度专家
爆炸的星星——突然的明亮增长
34.1 M
params
24
channels
1 day
interval
阅读论文
A
样本外
+2.21%/wk
ATLAS
仅基于OHLCV的指数和超大市值基准
承载世界的泰坦——稳定的基础
2.4 M
params
5
channels
1 day
interval
阅读论文
我们如何构建它们
Zirdle五人组共享一个共同的架构家族,但在资产池、输入通道和能力上有所不同。它们是完全从头训练的——而不是从任何开源权重的基础模型微调而来——因为金融时间序列需要领域特定的归纳偏好,而通用预训练会破坏这些偏好。
因子化注意力
受ViViT启发的因子化变压器首先关注每个时间块内的输入通道,然后关注每个通道内的时间块。在24个通道下,二次成本仍然可控。
分位数损失
每个模型使用分位数损失预测7个分位数(0.05, 0.10, 0.25, 0.50, 0.75, 0.90, 0.95)——这是一种用于概率预测的适当评分规则。这种联合位置+不确定性训练对风险意识分析至关重要。
机制感知训练窗口
日频模型在2010–2022年数据上训练。小数化前(2001年)、高频交易前(≤2007年)和全球金融危机(2007–2009)的数据被有意排除——在参数预算有限的情况下,旧机制数据是噪声,会从当前市场结构中夺走模型容量。
训练设置
架构系列分解通道×时间注意力
硬件4× NVIDIA A40 (48 GB)
训练窗口2010-01-01 → 2022-12-31(日频机器) / 2022-06 → 2024-06(日内)
样本外测试2024-07-01 → 2025-11-30(15周样本外)加6个月统一整体