本篇没啥主题,聊聊量化相关的书、用模型改代码、重构旧项目之类的。

推荐一本量化相关的书《Systematic Trading》

最近在看凌波的《量价时空》,觉得挺好,还买了两本,一本送朋友。他分别从:量、价、时、空四个角度分析,集成了量价关系,蜡烛图等常用技术。很多细节其实都能用程序实现,整体像是给了一套工具包,信息密度很大,但稍微有点散。

后来和 GPT5 聊这个,他给我推荐了 Robert Carver 的《Systematic Trading》。我看了介绍和第一章,有种“他乡遇故知”的感觉:他讲的和我最近从数据里看到的、操作体验很契合,加上作者文本力很强,就觉得很棒。

现在大多数的书相对来说偏向于归纳总结型,最大的问题是有知识没思考。看完似乎会了,但不知道该怎么用。偶尔在看盘时,联想到某个工具,但还未必用得对。

对作者的感觉是:始于技术,终于世界观。最喜欢他的一点是,他不是先提出自己的观点,再找证据证明自己的观点。他力求从正反两方面进行论证。书中包含了很多作者的真知灼见,绝不是那种为写而写的作品。

关于内容,目前看完第四章,他说的几乎每个大问题,都是我遇到过或者正在遇到的问题。比如:如何在多个策略中做选择,如何同时考虑稳定和盈利,如何做资产组合…… 都用得上。

在技术方面,他更多地从统计角度看问题,不只关注盘面上呈现的图和数,还有很多的数据分析和延伸测试。数据工程师和程序员使用的是两条不同的路径:数据师倾向梳理内部逻辑;而工程师喜欢找方法,然后直接把数据灌进去看效果。素材虽然一样,但结论可以千差万别。如果缺少提取、清理、筛选、分类,即便数据有规律也很难被发现,复杂度会呈几何倍数增长。

对于概念,比如:波动率、回撤和夏普比率的概念,书中不只是罗列公式,还讲出原理是什么,用法是什么。不过,对于没有数据分析背景的人来说,整篇讲分布、偏斜、假设检验,确实挺烧脑的。还是需要一些数学和统计的基础知识。反之,如果已经有了一些理论知识,这肯定是一个再好不过的演练场,每看一段都能启发相应的操作或者代码,真的很爽。

在实用性方面,内容也很接地气。比如我们都知道夏普比率越高越好,但什么范围是正常的?过高的夏普比率背后可能隐藏着负偏斜。这里展示了数据分布和一般范围,再看夏普比率的时候,心里就有数了。像有的书,

方法也很具体,比如有的书描述:有人赢钱的次数很多,但每次赢的钱少,亏的钱多,最终还是亏的。这种情况可能有心理原因,可能有市场原因,还可能是股票差异。这本书在技术层面定位的原因是:涨跌数据分布的正偏/负偏描述了更容易出现大涨还是大跌,这样就很容易做量化了。

百度搜了一下,国内读者的评价也非常高,但有个问题是没有中文版,有位小姐姐在知乎翻译了前九章,看网页又上我觉得有点松散,不方便笔记。

关于翻译工具

然后,开始翻译书。把我之前写的翻译工具找出来,想着复用一下老项目,结果二十多分钟环境没配起来,就有点崩溃了。

干脆把之前的代码和需求直接丢给 VSCode + Copilot + Claude Sonnet 4.5,让它重写,效果意外地好,又加了几个小的改进:

  • 图文结合:股票类的书必须配图看才明白。针对 epub,翻译前后格式几乎完全一致,很好地解决了图文对齐的问题。
  • 断点续传:用国外 LLM 经常遇到中转不稳定,翻一本书要很久,也花不少 token。中断后能从断点继续;或者先翻两页看看效果,再决定要不要继续,成本和时间都更可控。
  • 成本:这本用 gpt-4o-mini 翻的,大概花了六毛钱,翻译效果我完全能接受。如果用 gpt-5-nano 成本再降一点,性价比会更高。

这个工具主要是自用,顺手开个源,谁用得上就用用。基本原则就是:只做自己在用的功能,也没想做成大而全的东西。请自取:https://github.com/xieyan0811/llm_ebook_translator

关于重构

这次顺手体验了一下大模型重构项目。对于结构简单的项目,从架构、文档到代码,的确很惊喜。复杂一点的项目,先“解耦”,再交给模型去改,模型应该也能驾驭。有无编程辅助工具的效率差距,基本是两个量级。很多以前写的东西,现在回头再看,都值得重做一遍,现在的重构成本比想象中低很多。

不过这个过程也不可能完全交给模型,人还是得盯质控。这次来回沟通,我自己也敲了小几千字。感觉有点像:以前是手捏纸黏土,现在换成了 3D 打印,虽然后面还需要修边,但体验完全不一样。