ETF筛选与方法总结

1 引入

前两天统计自己持仓时，惊讶地发现目前持仓的 60%以上都是 ETF，甚至都不记得自己是什么时候慢慢换过去的，吓了一跳。这些 ETF 基本都是听同事、同学、某个大 V 一说就买了，这种方式显然不是最优的。

于是查了一些数据，想看看全市场公募基金（包含货币型、债券型、股票型、混合型、ETF等所有类型基金）在近几年的整体变化情况。目前总规模约 36 万亿元（使用 akshare 的 fund_aum_trend_em 获取 2026年1月数据）。2025 年 8 月，A 股总市值首次突破 100 万亿元，我们可以对比来看基金的规模。

为什么这几年大家都更倾向于买基金？可能是：越来越多人接受了自己并没有那么专业、也不擅长选股，但又看好整体行情，与其执着于获取 Alpha，不如放弃选股，转而获取 Beta 收益。这背后，除了个人投资者的自我认知变化，或许也与A股市场机构化、‘去散户化’的长期趋势，以及基金投顾等‘代客理财’模式的兴起有关。

基金又分为主动和被动型。在同一主题下，不同基金经理的操作差异，带来的收益差别很大。以前沿科技相关 ETF 为例，去年收益从 -20% 到 +80% 不等。这也说明，并不是看好某个方向，随便买一只 ETF 就一定能赚钱。

本文就来介绍一些分析和筛选方法。

2 分类

ETF (交易所交易基金)，它像股票一样，在证券交易所的交易时段内实时买卖。它的组合透明度高，通常每日公布持仓，指数ETF的持仓完全透明。以被动指数型为主（跟踪沪深300、行业指数等），也有主动型、商品型等。首先可以通过配置不同类型的 ETF，来组合相关性较低的资产，以缓解极端行情下的回撤冲击（数据来自 tushare 的 fund_basic）。

再看我们最关注的股票型 ETF，剔除退市产品后，数量也有 1500+。

通过名字对 ETF 进行分类有一定难度：有的按行业划分（科技、医药），有的按宽基指数（大盘 / 中小盘），有的按地域，还有不少名称与实际持仓并不完全一致。

因此这里只做非常粗略的数据分析：先由 AI 按名称做初步分类，我再结合自己的理解手动调整。最终得到二级分类统计（前 30 名）如下：大盘 A 股 180，医药健康 98，中盘 A 股 84，科技 A 股 73，前沿科技 68，大金融 64，碳中和 58，港股 55，红利高股息 49，硬科技 44，港股科技 42，质量因子 36，指数增强 34，大消费 33，小盘 A 股 32，成长 A 股 31，封闭式基金 29，软件信息 27，智能车 26，港股红利 24，有色金属 24，A 股主题 22，深证指数 22，航空航天 21，区域经济 20，商品 19，普通 LOF 19，互联网 19，基础设施 18，电力能源 17。

3 方法

下面总结了一套我个人在选择 ETF 时使用的简单方法，从粗到细分为三步：

第一步：选赛道，目标是捕捉未来一段时间内更具优势的方向；
第二步：选产品，在赛道内比较稳定性和业绩；
第三步：深度分析具体产品，查看持仓结构、成分股 ROE / PE，判断其偏基本面、成长还是主题博弈，并据此理解它的风险与交易方式。

3.1 选赛道

选赛道大致有两种路径：一种是基于个人认知与舆论环境的判断，比如未来发展方向、热门产业链及上下游，这类判断不是程序直接算出来的，但现在可以部分借助大模型辅助分析；另一种是从数据中捕捉变化的“蛛丝马迹”。

仅关注基金历史涨跌，本质上是回顾性方法——过去的数据无法代表未来，它常常包含已退潮的热点或主动型基金的历史操作策略。相比之下，新成立的基金通常更具前瞻性，其集中布局的方向，往往是当前市场普遍看好的主题，押注的是未来一段时间的趋势。

以下是一些可以通过程序持续追踪的指标。

3.1.1 新颖性与资金流

关注新上市的 ETF（尤其是首发主题）。
观察规模快速增长的 ETF（AUM 周 / 月环比）。
跟踪热门产业链上下游的资金传导逻辑。

3.1.2 趋势与轮动

判断宏观周期位置（复苏、过热、滞胀、衰退）。
关注创出 52 周新高，尤其是相对强度新高的 ETF。
跟踪市场情绪与新闻舆情变化。
参考机构或知名投资者公开披露的持仓动向。

3.1.3 实验数据

下图统计了近半年新成立 ETF 数量最多的二级分类。整体结果与主观感受较为一致，只是通过数据进一步量化了“热度”——不仅知道它热，还知道热到什么程度。

3.2 选产品

在确定赛道后，对比该赛道内不同 ETF 的核心指标，筛选相对更优的产品。

3.2.1 风险收益效率

夏普比率（越高越好）。
波动率（越小越好）。
最大回撤（越小越好）。

3.2.2 估值与热度

历史估值分位：PE / PB 在自身历史中的位置，用于判断是否短期涨幅过大。
相对估值分位：与全市场估值水平对比。
交易热度：关注换手率是否异常放大。

3.2.3 实验数据

以“前沿科技”相关 ETF 为例，共 68 支，其中有 34 支成立于 2025-01-01 之前，可以用来观察其 2025 年的整体表现；同时也能看到，剩余一半成立于 2025 年之后，反映了该赛道的高热度。

对这 34 支 ETF 近一年的价格变化进行对比后发现：最差的亏损接近 20%，最好的收益超过 80%。这说明，买 ETF 除了选行业，选具体产品同样关键。

下图展示了收益排名前 10 和后 5 的变化率、最大回撤与年化波动。可以看到，前 5 在盈利能力、回撤和波动控制上整体表现都更好。

3.3 深度分析

对最终筛选出的少数 ETF，进一步做持仓层面的分析：

计算成分股的加权平均 PE、ROE 等基本面指标。
分析前十大成分股权重集中度（集中度越高，波动通常越大）。
借助 AI 工具分析成分股组合设计逻辑、行业分布与策略纯度。

3.3.1 实验数据

这里对收益排名第一和最后一名的 ETF，分析了其持仓、换股频率以及前十大成分股的集中度。两者集中度均在 50%~60%，差异并不明显。第一名只在第四季度仅调整过一只成分股，而最后一名几乎每个季度都会调整 3~4 只，第四季度与第一季度相比共有 5 只不同。

但单个样本并不具备很强代表性：换股频繁不一定更差，不换也未必更好；历史涨幅高不意味着未来一定还能继续上涨，反而可能已经处在高位。因此这里不再展开具体数据。

这些分析的意义在于：一方面可以排除明显低于行业平均水平、操作逻辑不太行的产品，减少踩雷概率（只在同一赛道才有可比性）；另一方面，在看到具体持仓后，往往能很直观地判断出哪些 ETF 对未来的判断以及选股风格与你是一致的。

4 总结

回头看，以前做股票更偏启发式选股；现在用这种方式筛选 ETF，更像是遍历与过滤，对不熟悉的行业尤其友好——至少先建立一个清晰的“概念画像”。

第一层决定方向，第二层比较产品，第三层剖析本质。
可按此流程先初筛，建立观察池，再结合市场环境做最终决策。