00 导读:量化投资技术的全局地图¶
本章不讲具体方法,只做两件事:画一张地图(量化系统由哪些环节构成、技术脉络如何演化),和给一套读法(怎么用这份综述 + 配套教学指南)。后续每一章都会回到这张地图上的某个位置。
0.1 这份综述回答什么、不回答什么¶
回答:
- 量化投资从"规则/统计套利"到"机器学习/深度学习",再到"大模型/Agent"的技术脉络——不仅是"有哪些方法",更是"为什么会从上一步演化到下一步、每种方法的适用边界与失败模式"。
- 每类方法的核心原理与必要公式、代表性工作、以及在 A 股/实务中落地的关键坑。
- 一套可对照动手的教学指南(见 ../guide/),把综述里的"为什么"变成可运行的"怎么做"。
不回答(刻意不展开): - 不给"稳赚策略"或具体可直接照抄的盈利参数——市场是对抗性的,公开即衰减。 - 不做完整的数学证明体系(只给理解所需的公式);严谨推导留给教材(见 references)。 - 不是投顾建议,不构成任何交易推荐。
定位:给自己看的深度学习笔记式综述,引用不限论文,也含书籍、框架文档、开源仓库与权威网络资料(见 references.md)。
0.2 一张地图:量化系统的五个环节¶
无论用线性回归还是用 LLM Agent,一套量化系统都可以拆成同一条流水线。方法在变,骨架不变——这是阅读全书的主线。
┌─────────────────────────────────────────────────────────┐
│ 评估 / 回测 / 归因(贯穿全程) │
└─────────────────────────────────────────────────────────┘
▲ ▲ ▲ ▲
① 数据 ───────► ② 预测/信号 ───► ③ 组合构建 ───► ④ 交易执行 ───► ⑤ 风险控制
(行情/基本面/ (因子、ML、DL、 (优化、风险 (下单、滑点、 (回撤、敞口、
另类/文本) RL、LLM) 预算、约束) 冲击、T+1) 失效监控)
| 环节 | 一句话定位 | 综述章 | 指南章 |
|---|---|---|---|
| ① 数据与特征 | 信号的天花板由数据决定;偏差在此埋下 | 02 | ch00–ch01 |
| ② 预测/信号 | 全书技术演化的主战场(ML→DL→RL→LLM→Agent) | 04–10 | ch03、ch05–ch12 |
| ③ 组合构建 | 把"预测"变成"持仓":收益、风险与约束的权衡 | 03、12 | ch02、ch13 |
| ④ 交易执行 | 纸面收益与真实收益之间的鸿沟 | 08、11 | ch04、ch14 |
| ⑤ 风险控制 | 活下来比跑得快更重要 | 12 | ch13 |
| 🔁 评估/回测/归因 | 防自欺的免疫系统;过拟合是头号敌人 | 11 | ch04、ch14 |
关键认知:大多数人把注意力全押在环节②("用什么模型预测"),但实战中①数据质量、③④的成本约束、🔁的过拟合治理,往往才是收益能否落地的决定因素。这份综述会反复强调这一点。
0.3 技术脉络一图流:从规则到 Agent¶
环节②的"预测/信号"是技术演化最剧烈的地方。脉络可以浓缩成一条线(每一步都是为了解决上一步的某个局限):
规则/技术分析 ─► 统计套利/协整 ─► 线性因子模型 ─► 传统机器学习 ─► 深度学习 ─► 强化学习 ─► 大模型(LLM) ─► LLM Agent
(人定规则) (均值回复) (Fama-French) (GBDT/XGB) (LSTM/Tfm/GNN) (端到端决策) (文本/推理/预测) (自主研究闭环)
- 规则 → 统计套利:从"人凭经验定规则"到"用统计关系(如协整)找可重复的微弱优势"。
- 统计套利 → 因子模型:把收益解释为对若干系统性因子(价值、动量、规模…)的暴露,可解释、可组合(综述 03–04)。
- 因子 → 传统 ML:因子是线性、人工设计的;GBDT/XGBoost 能捕捉非线性与交互,但仍依赖人工特征(综述 05)。
- 传统 ML → 深度学习:让模型自己学时序/截面/图结构的表征(LSTM、Transformer、GNN),减少手工特征依赖(综述 06–07)。
- 预测 → 强化学习:不止"预测涨跌",而是把交易/组合/执行建模为序贯决策(MDP),直接优化最终收益与成本(综述 08)。
- 深度学习 → 大模型:用 LLM 理解非结构化文本(新闻、研报、财报),并出现时序基础模型做 zero-shot 预测(综述 09)。
- 大模型 → Agent:LLM 不只当"模型",而当会用工具、有记忆、能规划与反思的研究/交易主体,尝试自动化"提假设→取数→回测→迭代"的闭环(综述 10)。
⚠️ 脉络是"叠加"不是"替代":2026 年的实战系统里,GBDT 仍是 Alpha 预测的主力,深度学习/LLM/Agent 是在特定场景(关系建模、文本另类数据、研究提效)上的增量,而非全面取代。综述会对每一步给"何时真的更强"的诚实评价。
0.4 怎么读:三条路径¶
- 建立全局认知(推荐先走一遍):按
00 → 01 → 02 → 03 → 04读完"地基"(数据、组合、因子、回测),再按兴趣跳读 05–10 的方法章,最后读 11–14 的评估/风控/生态/展望。 - 只关心 AI 前沿:先读 00、再读 05(ML 范式)→ 06(DL)→ 08(RL)→ 09(LLM)→ 10(Agent),但务必回看 11(过拟合治理),否则前沿方法会把你带进"回测幻觉"。
- 边读边动手:每章末尾的"对应指南章"链到
../guide/的可运行实现。综述讲"为什么",指南讲"怎么做",两者章节一一呼应(对照表见../PLAN.md§5)。
0.5 贯穿全书的三条警戒线¶
这三件事是量化区别于一般机器学习的根本难点,会在几乎每一章出现:
- 低信噪比:金融收益的可预测部分极小(日频 IC 能稳定到 0.03–0.05 已属不错)。模型容量越大越容易"把噪声当信号"。
- 非平稳与对抗性:规律会漂移、会因被人发现而失效(拥挤交易)。样本内的"圣杯"常在样本外蒸发。
- 过拟合是头号敌人:在同一份历史上反复试错,必然挑出"运气最好"的策略。需要 Purged/CPCV 交叉验证、Deflated Sharpe、回测过拟合概率(PBO)等专门武器(综述 11;López de Prado 的核心告诫,[R13])。
记住一句话:"一个漂亮的回测曲线,默认假设它是过拟合的,直到被严格证伪。"
0.6 符号与术语约定¶
| 符号 | 含义 |
|---|---|
| \(r_{t}\) | 简单收益率 \(r_t = P_t/P_{t-1}-1\) |
| \(\tilde r_t = \ln(P_t/P_{t-1})\) | 对数收益率(可加性,便于跨期求和) |
| \(\mathbf{w}\) | 组合权重向量 |
| \(\boldsymbol{\mu},\ \boldsymbol{\Sigma}\) | 期望收益向量、收益协方差矩阵 |
| IC / RankIC | 预测值与未来收益的(秩)相关系数,信号质量核心指标 |
| IR | 信息比率 = 超额收益均值 / 跟踪误差 |
| Sharpe | 夏普比率 = (收益−无风险)/ 波动率 |
| Alpha / Beta | 超额(主动)收益 / 对系统性因子的暴露 |
| 因子中性化 | 剔除行业、市值等已知暴露后的"纯净"信号 |
| T+1 / 涨跌停 | A 股制度约束:当日买入次日才可卖;±10%(主板)等价格限制 |
术语首次出现时给中英文对照;英文库名/模型名保留原文(如 Qlib、LightGBM、Transformer)。
0.7 小结与下一步¶
- 量化系统 = 数据 → 信号 → 组合 → 执行 → 风控,外加贯穿的评估/回测/归因;方法在变,骨架不变。
- 技术脉络是一条"为解决上一步局限而演化"的线:规则 → 统计套利 → 因子 → ML → DL → RL → LLM → Agent,且叠加而非替代。
- 三条警戒线——低信噪比、非平稳、过拟合——决定了量化与普通 ML 的根本区别。
下一章(01 全景与简史):把这张地图放回历史,看每个阶段是被什么问题与什么人推动出现的,并系统对比 A 股与美股市场在数据、制度、参与者结构上的差异——这些差异直接决定了后面每种方法在 A 股能否奏效。
引用见 references.md([R13] López de Prado 2018;[R15] Gu-Kelly-Xiu 2020;[R45] d2l.ai)。配套实现见 ../guide/。