1 引入

前两天统计自己持仓时,惊讶地发现目前持仓的 60%以上都是 ETF,甚至都不记得自己是什么时候慢慢换过去的,吓了一跳。这些 ETF 基本都是听同事、同学、某个大 V 一说就买了,这种方式显然不是最优的。

于是查了一些数据,想看看全市场公募基金(包含货币型、债券型、股票型、混合型、ETF等所有类型基金)在近几年的整体变化情况。目前总规模约 36 万亿元(使用 akshare 的 fund_aum_trend_em 获取 2026年1月数据)。2025 年 8 月,A 股总市值首次突破 100 万亿元,我们可以对比来看基金的规模。

为什么这几年大家都更倾向于买基金?可能是:越来越多人接受了自己并没有那么专业、也不擅长选股,但又看好整体行情,与其执着于获取 Alpha,不如放弃选股,转而获取 Beta 收益。这背后,除了个人投资者的自我认知变化,或许也与A股市场机构化、‘去散户化’的长期趋势,以及基金投顾等‘代客理财’模式的兴起有关。

基金又分为主动和被动型。在同一主题下,不同基金经理的操作差异,带来的收益差别很大。以前沿科技相关 ETF 为例,去年收益从 -20% 到 +80% 不等。这也说明,并不是看好某个方向,随便买一只 ETF 就一定能赚钱。

本文就来介绍一些分析和筛选方法。

2 分类

ETF (交易所交易基金),它像股票一样,在证券交易所的交易时段内实时买卖。它的组合透明度高,通常每日公布持仓,指数ETF的持仓完全透明。以被动指数型为主(跟踪沪深300、行业指数等),也有主动型、商品型等。首先可以通过配置不同类型的 ETF,来组合相关性较低的资产,以缓解极端行情下的回撤冲击(数据来自 tushare 的 fund_basic)。

再看我们最关注的股票型 ETF,剔除退市产品后,数量也有 1500+。

通过名字对 ETF 进行分类有一定难度:有的按行业划分(科技、医药),有的按宽基指数(大盘 / 中小盘),有的按地域,还有不少名称与实际持仓并不完全一致。

因此这里只做非常粗略的数据分析:先由 AI 按名称做初步分类,我再结合自己的理解手动调整。最终得到二级分类统计(前 30 名)如下:大盘 A 股 180,医药健康 98,中盘 A 股 84,科技 A 股 73,前沿科技 68,大金融 64,碳中和 58,港股 55,红利高股息 49,硬科技 44,港股科技 42,质量因子 36,指数增强 34,大消费 33,小盘 A 股 32,成长 A 股 31,封闭式基金 29,软件信息 27,智能车 26,港股红利 24,有色金属 24,A 股主题 22,深证指数 22,航空航天 21,区域经济 20,商品 19,普通 LOF 19,互联网 19,基础设施 18,电力能源 17。

3 方法

下面总结了一套我个人在选择 ETF 时使用的简单方法,从粗到细分为三步:

  • 第一步:选赛道,目标是捕捉未来一段时间内更具优势的方向;
  • 第二步:选产品,在赛道内比较稳定性和业绩;
  • 第三步:深度分析具体产品,查看持仓结构、成分股 ROE / PE,判断其偏基本面、成长还是主题博弈,并据此理解它的风险与交易方式。

3.1 选赛道

选赛道大致有两种路径:一种是基于个人认知与舆论环境的判断,比如未来发展方向、热门产业链及上下游,这类判断不是程序直接算出来的,但现在可以部分借助大模型辅助分析; 另一种是从数据中捕捉变化的“蛛丝马迹”。

仅关注基金历史涨跌,本质上是回顾性方法——过去的数据无法代表未来,它常常包含已退潮的热点或主动型基金的历史操作策略。相比之下,新成立的基金通常更具前瞻性,其集中布局的方向,往往是当前市场普遍看好的主题,押注的是未来一段时间的趋势。

以下是一些可以通过程序持续追踪的指标。

3.1.1 新颖性与资金流

  • 关注新上市的 ETF(尤其是首发主题)。
  • 观察规模快速增长的 ETF(AUM 周 / 月环比)。
  • 跟踪热门产业链上下游的资金传导逻辑。

3.1.2 趋势与轮动

  • 判断宏观周期位置(复苏、过热、滞胀、衰退)。
  • 关注创出 52 周新高,尤其是相对强度新高的 ETF。
  • 跟踪市场情绪与新闻舆情变化。
  • 参考机构或知名投资者公开披露的持仓动向。

3.1.3 实验数据

下图统计了近半年新成立 ETF 数量最多的二级分类。整体结果与主观感受较为一致,只是通过数据进一步量化了“热度”——不仅知道它热,还知道热到什么程度。

3.2 选产品

在确定赛道后,对比该赛道内不同 ETF 的核心指标,筛选相对更优的产品。

3.2.1 风险收益效率

  • 夏普比率(越高越好)。
  • 波动率(越小越好)。
  • 最大回撤(越小越好)。

3.2.2 估值与热度

  • 历史估值分位:PE / PB 在自身历史中的位置,用于判断是否短期涨幅过大。
  • 相对估值分位:与全市场估值水平对比。
  • 交易热度:关注换手率是否异常放大。

3.2.3 实验数据

以“前沿科技”相关 ETF 为例,共 68 支,其中有 34 支成立于 2025-01-01 之前,可以用来观察其 2025 年的整体表现;同时也能看到,剩余一半成立于 2025 年之后,反映了该赛道的高热度。

对这 34 支 ETF 近一年的价格变化进行对比后发现:最差的亏损接近 20%,最好的收益超过 80%。这说明,买 ETF 除了选行业,选具体产品同样关键

下图展示了收益排名前 10 和后 5 的变化率、最大回撤与年化波动。可以看到,前 5 在盈利能力、回撤和波动控制上整体表现都更好。

3.3 深度分析

对最终筛选出的少数 ETF,进一步做持仓层面的分析:

  • 计算成分股的加权平均 PE、ROE 等基本面指标。
  • 分析前十大成分股权重集中度(集中度越高,波动通常越大)。
  • 借助 AI 工具分析成分股组合设计逻辑、行业分布与策略纯度。

3.3.1 实验数据

这里对收益排名第一和最后一名的 ETF,分析了其持仓、换股频率以及前十大成分股的集中度。两者集中度均在 50%~60%,差异并不明显。第一名只在第四季度仅调整过一只成分股,而最后一名几乎每个季度都会调整 3~4 只,第四季度与第一季度相比共有 5 只不同。

但单个样本并不具备很强代表性:换股频繁不一定更差,不换也未必更好;历史涨幅高不意味着未来一定还能继续上涨,反而可能已经处在高位。因此这里不再展开具体数据。

这些分析的意义在于:一方面可以排除明显低于行业平均水平、操作逻辑不太行的产品,减少踩雷概率(只在同一赛道才有可比性);另一方面,在看到具体持仓后,往往能很直观地判断出哪些 ETF 对未来的判断以及选股风格与你是一致的。

4 总结

回头看,以前做股票更偏启发式选股;现在用这种方式筛选 ETF,更像是遍历与过滤,对不熟悉的行业尤其友好——至少先建立一个清晰的“概念画像”。

  • 第一层决定方向,第二层比较产品,第三层剖析本质。
  • 可按此流程先初筛,建立观察池,再结合市场环境做最终决策。