00 导读：量化投资技术的全局地图¶

本章不讲具体方法，只做两件事：画一张地图（量化系统由哪些环节构成、技术脉络如何演化），和给一套读法（怎么用这份综述 + 配套教学指南）。后续每一章都会回到这张地图上的某个位置。

0.1 这份综述回答什么、不回答什么¶

回答： - 量化投资从"规则/统计套利"到"机器学习/深度学习"，再到"大模型/Agent"的技术脉络——不仅是"有哪些方法"，更是"为什么会从上一步演化到下一步、每种方法的适用边界与失败模式"。 - 每类方法的核心原理与必要公式、代表性工作、以及在 A 股/实务中落地的关键坑。 - 一套可对照动手的教学指南（见 ../guide/），把综述里的"为什么"变成可运行的"怎么做"。

不回答（刻意不展开）： - 不给"稳赚策略"或具体可直接照抄的盈利参数——市场是对抗性的，公开即衰减。 - 不做完整的数学证明体系（只给理解所需的公式）；严谨推导留给教材（见 references）。 - 不是投顾建议，不构成任何交易推荐。

定位：给自己看的深度学习笔记式综述，引用不限论文，也含书籍、框架文档、开源仓库与权威网络资料（见 references.md）。

0.2 一张地图：量化系统的五个环节¶

无论用线性回归还是用 LLM Agent，一套量化系统都可以拆成同一条流水线。方法在变，骨架不变——这是阅读全书的主线。

              ┌─────────────────────────────────────────────────────────┐
              │                  评估 / 回测 / 归因（贯穿全程）            │
              └─────────────────────────────────────────────────────────┘
                         ▲           ▲            ▲           ▲
   ① 数据 ───────► ② 预测/信号 ───► ③ 组合构建 ───► ④ 交易执行 ───► ⑤ 风险控制
  (行情/基本面/    (因子、ML、DL、    (优化、风险    (下单、滑点、    (回撤、敞口、
   另类/文本)       RL、LLM)          预算、约束)     冲击、T+1)       失效监控)

环节	一句话定位	综述章	指南章
① 数据与特征	信号的天花板由数据决定；偏差在此埋下	02	ch00–ch01
② 预测/信号	全书技术演化的主战场（ML→DL→RL→LLM→Agent）	04–10	ch03、ch05–ch12
③ 组合构建	把"预测"变成"持仓"：收益、风险与约束的权衡	03、12	ch02、ch13
④ 交易执行	纸面收益与真实收益之间的鸿沟	08、11	ch04、ch14
⑤ 风险控制	活下来比跑得快更重要	12	ch13
🔁 评估/回测/归因	防自欺的免疫系统；过拟合是头号敌人	11	ch04、ch14

关键认知：大多数人把注意力全押在环节②（"用什么模型预测"），但实战中①数据质量、③④的成本约束、🔁的过拟合治理，往往才是收益能否落地的决定因素。这份综述会反复强调这一点。

0.3 技术脉络一图流：从规则到 Agent¶

环节②的"预测/信号"是技术演化最剧烈的地方。脉络可以浓缩成一条线（每一步都是为了解决上一步的某个局限）：

规则/技术分析 ─► 统计套利/协整 ─► 线性因子模型 ─► 传统机器学习 ─► 深度学习 ─► 强化学习 ─► 大模型(LLM) ─► LLM Agent
  (人定规则)     (均值回复)       (Fama-French)    (GBDT/XGB)     (LSTM/Tfm/GNN)  (端到端决策)  (文本/推理/预测)  (自主研究闭环)

规则 → 统计套利：从"人凭经验定规则"到"用统计关系（如协整）找可重复的微弱优势"。
统计套利 → 因子模型：把收益解释为对若干系统性因子（价值、动量、规模…）的暴露，可解释、可组合（综述 03–04）。
因子 → 传统 ML：因子是线性、人工设计的；GBDT/XGBoost 能捕捉非线性与交互，但仍依赖人工特征（综述 05）。
传统 ML → 深度学习：让模型自己学时序/截面/图结构的表征（LSTM、Transformer、GNN），减少手工特征依赖（综述 06–07）。
预测 → 强化学习：不止"预测涨跌"，而是把交易/组合/执行建模为序贯决策(MDP)，直接优化最终收益与成本（综述 08）。
深度学习 → 大模型：用 LLM 理解非结构化文本（新闻、研报、财报），并出现时序基础模型做 zero-shot 预测（综述 09）。
大模型 → Agent：LLM 不只当"模型"，而当会用工具、有记忆、能规划与反思的研究/交易主体，尝试自动化"提假设→取数→回测→迭代"的闭环（综述 10）。

⚠️ 脉络是"叠加"不是"替代"：2026 年的实战系统里，GBDT 仍是 Alpha 预测的主力，深度学习/LLM/Agent 是在特定场景（关系建模、文本另类数据、研究提效）上的增量，而非全面取代。综述会对每一步给"何时真的更强"的诚实评价。

0.4 怎么读：三条路径¶

建立全局认知（推荐先走一遍）：按 00 → 01 → 02 → 03 → 04 读完"地基"（数据、组合、因子、回测），再按兴趣跳读 05–10 的方法章，最后读 11–14 的评估/风控/生态/展望。
只关心 AI 前沿：先读 00、再读 05（ML 范式）→ 06（DL）→ 08（RL）→ 09（LLM）→ 10（Agent），但务必回看 11（过拟合治理），否则前沿方法会把你带进"回测幻觉"。
边读边动手：每章末尾的"对应指南章"链到 ../guide/ 的可运行实现。综述讲"为什么"，指南讲"怎么做"，两者章节一一呼应（对照表见 ../PLAN.md §5）。

0.5 贯穿全书的三条警戒线¶

这三件事是量化区别于一般机器学习的根本难点，会在几乎每一章出现：

低信噪比：金融收益的可预测部分极小（日频 IC 能稳定到 0.03–0.05 已属不错）。模型容量越大越容易"把噪声当信号"。
非平稳与对抗性：规律会漂移、会因被人发现而失效（拥挤交易）。样本内的"圣杯"常在样本外蒸发。
过拟合是头号敌人：在同一份历史上反复试错，必然挑出"运气最好"的策略。需要 Purged/CPCV 交叉验证、Deflated Sharpe、回测过拟合概率(PBO)等专门武器（综述 11；López de Prado 的核心告诫，[R13]）。

记住一句话："一个漂亮的回测曲线，默认假设它是过拟合的，直到被严格证伪。"

0.6 符号与术语约定¶

符号	含义
\(r_{t}\)	简单收益率 \(r_t = P_t/P_{t-1}-1\)
\(\tilde r_t = \ln(P_t/P_{t-1})\)	对数收益率（可加性，便于跨期求和）
\(\mathbf{w}\)	组合权重向量
\(\boldsymbol{\mu},\ \boldsymbol{\Sigma}\)	期望收益向量、收益协方差矩阵
IC / RankIC	预测值与未来收益的（秩）相关系数，信号质量核心指标
IR	信息比率 = 超额收益均值 / 跟踪误差
Sharpe	夏普比率 = （收益−无风险）/ 波动率
Alpha / Beta	超额（主动）收益 / 对系统性因子的暴露
因子中性化	剔除行业、市值等已知暴露后的"纯净"信号
T+1 / 涨跌停	A 股制度约束：当日买入次日才可卖；±10%(主板)等价格限制

术语首次出现时给中英文对照；英文库名/模型名保留原文（如 Qlib、LightGBM、Transformer）。

0.7 小结与下一步¶

量化系统 = 数据 → 信号 → 组合 → 执行 → 风控，外加贯穿的评估/回测/归因；方法在变，骨架不变。
技术脉络是一条"为解决上一步局限而演化"的线：规则 → 统计套利 → 因子 → ML → DL → RL → LLM → Agent，且叠加而非替代。
三条警戒线——低信噪比、非平稳、过拟合——决定了量化与普通 ML 的根本区别。

下一章（01 全景与简史）：把这张地图放回历史，看每个阶段是被什么问题与什么人推动出现的，并系统对比 A 股与美股市场在数据、制度、参与者结构上的差异——这些差异直接决定了后面每种方法在 A 股能否奏效。

引用见 references.md（[R13] López de Prado 2018；[R15] Gu-Kelly-Xiu 2020；[R45] d2l.ai）。配套实现见 ../guide/。