Python量化交易入门：从数据获取到策略回测的完整流程

2025年10月11日量化投资 sunqi.org

量化交易不再是对冲基金的专利。随着Python生态和开源数据平台的成熟，一个有编程基础的个人投资者可以在周末搭建并测试自己的量化策略。本文提供一个完整的入门流程：从数据获取到策略回测，帮助你迈出量化的第一步。

数据获取：免费与付费方案

免费数据源：Yahoo Finance（yfinance Python库，获取美股、ETF日线数据）；Alpha Vantage（提供部分免费API额度，适合入门）；Stooq（欧美股市历史数据，yfinance支持）；Deutsche Börse数据（xetra，法兰克福交易所官方开放数据）。

付费数据源：Quandl/Nasdaq Data Link（高质量因子数据、期货数据）；Refinitiv（专业级数据，价格高）。对于初学者，yfinance获取的Yahoo数据完全够用。

import yfinance as yf
import pandas as pd

# 获取DAX指数成分股数据
dax_ticker = "^GDAXI"
data = yf.download(dax_ticker, start="2020-01-01", end="2024-12-31")
print(data.tail())

一个简单的均线交叉策略

import yfinance as yf
import pandas as pd
import matplotlib.pyplot as plt

# 下载数据
df = yf.download("MSFT", start="2022-01-01", end="2024-12-31")["Close"]
df = df.to_frame(name="Close")

# 计算均线
df["SMA20"] = df["Close"].rolling(20).mean()
df["SMA50"] = df["Close"].rolling(50).mean()

# 信号生成
df["Signal"] = 0
df.loc[df["SMA20"] > df["SMA50"], "Signal"] = 1   # 买入信号
df.loc[df["SMA20"] < df["SMA50"], "Signal"] = -1  # 卖出信号

# 计算策略收益
df["Returns"] = df["Close"].pct_change()
df["Strategy"] = df["Signal"].shift(1) * df["Returns"]
df[["Returns", "Strategy"]].cumsum().apply(lambda x: x.exp()).plot(
    title="Strategy vs Buy&Hold"
)
plt.show()

量化交易完整教程