公募基金重仓股一直是市场的焦点,有人抄作业靠它挣钱,有人抄作业被它坑惨,个中差别在于时机的把握和独立分析判断,而不是后知后觉人云亦云。不管怎样,是抄作业也好,还是防入坑,规避机构重仓股也好,第一时间获知机构重仓股以及份额比例变化很重要。当然,关键数据还是自己动手,丰衣足食。
比如,2023年基金四季报于2024年1月22日全部披露完毕,第一步首先要准备数据。我在对比使用了万德、东方财富choice数据接口、网易财经数据接口与tushare数据接口后,最终还是选择了tushare。它数据更全,功能更强大,对高校师生研究也有优惠,有一定积分后可以免费访问。
Tushare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。考虑到Python pandas包在金融量化分析中体现出的优势,Tushare返回的绝大部分的数据格式都是pandas DataFrame类型,非常便于用pandas/NumPy/Matplotlib进行数据分析和可视化。当然,如果您习惯了用Excel或者关系型数据库做分析,您也可以通过Tushare的数据存储功能,将数据全部保存到本地后进行分析。Tushare还在不断的完善和优化,逐步增加了港股、期货、外汇和基金方面的数据。这个基金与指数方面的数据简直就是我们普通基金投资者的福音,可以通过净值数据、持仓数据、管理规模数据等做各种策略分析。
说回数据准备,大致思路介绍如下:
第一步:通过pro.query_fund_basic获取当前市场所有的基金列表并保存,作为基金查询数据库;先不做类别区分,可以看到目前国内全市场基金已经有19418支(成立日截止20230601),接近两万!所以有人说现在选基比选股还难。
第二步:通过pro.query_stock_name获取股票列表,主要是后面查询基金持仓时,做股票名称的查询映射;可以看到主板+创业板+科创板+北交所共有5344支,上市股票数量真是雄冠全球!所有有人说A股光长胖不长高,大股东是最大的空头。
第三步:基于第一步生产的基金列表,以股票型、混合型、配置股票的二级债基等类别为筛选条件,以场内E或者场外O为查询类别(主要是场外数量太多,EO放一起查询容易导致服务器拒绝),设置公告起始日,通过pro.fund_portfolio获取公募基金持仓数据。单次查询得到公告重仓股,配合第二步得到的股票列表,补全股票名称,最后合并查询得到如下总表:
这样我们就查询得到了所有公募基金当前公告的所有重仓股了,此处我们统计场内交易的基金(ETF、LOF、封基)作为展示。基于此数据表,不仅可以统计机构前十大重仓股,获知财经媒体文章的报道结果,也可以统计分析有机构持仓但非集中抱团的个股,也可以分析个股环比的增减情况等。数据源有了,自己想分析或者跑策略都可以,了解数据全貌,而非媒体喂给我们的二手结果。如下场内基金的重仓股可视化排名统计,还是能看到一些不同的身影。
比如,2023年基金四季报于2024年1月22日全部披露完毕,第一步首先要准备数据。我在对比使用了万德、东方财富choice数据接口、网易财经数据接口与tushare数据接口后,最终还是选择了tushare。它数据更全,功能更强大,对高校师生研究也有优惠,有一定积分后可以免费访问。
Tushare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。考虑到Python pandas包在金融量化分析中体现出的优势,Tushare返回的绝大部分的数据格式都是pandas DataFrame类型,非常便于用pandas/NumPy/Matplotlib进行数据分析和可视化。当然,如果您习惯了用Excel或者关系型数据库做分析,您也可以通过Tushare的数据存储功能,将数据全部保存到本地后进行分析。Tushare还在不断的完善和优化,逐步增加了港股、期货、外汇和基金方面的数据。这个基金与指数方面的数据简直就是我们普通基金投资者的福音,可以通过净值数据、持仓数据、管理规模数据等做各种策略分析。
说回数据准备,大致思路介绍如下:
第一步:通过pro.query_fund_basic获取当前市场所有的基金列表并保存,作为基金查询数据库;先不做类别区分,可以看到目前国内全市场基金已经有19418支(成立日截止20230601),接近两万!所以有人说现在选基比选股还难。
第二步:通过pro.query_stock_name获取股票列表,主要是后面查询基金持仓时,做股票名称的查询映射;可以看到主板+创业板+科创板+北交所共有5344支,上市股票数量真是雄冠全球!所有有人说A股光长胖不长高,大股东是最大的空头。
第三步:基于第一步生产的基金列表,以股票型、混合型、配置股票的二级债基等类别为筛选条件,以场内E或者场外O为查询类别(主要是场外数量太多,EO放一起查询容易导致服务器拒绝),设置公告起始日,通过pro.fund_portfolio获取公募基金持仓数据。单次查询得到公告重仓股,配合第二步得到的股票列表,补全股票名称,最后合并查询得到如下总表:
这样我们就查询得到了所有公募基金当前公告的所有重仓股了,此处我们统计场内交易的基金(ETF、LOF、封基)作为展示。基于此数据表,不仅可以统计机构前十大重仓股,获知财经媒体文章的报道结果,也可以统计分析有机构持仓但非集中抱团的个股,也可以分析个股环比的增减情况等。数据源有了,自己想分析或者跑策略都可以,了解数据全貌,而非媒体喂给我们的二手结果。如下场内基金的重仓股可视化排名统计,还是能看到一些不同的身影。
Edge
Chrome
Firefox




京公网安备 11010802031449号