半岛全站那么多股票怎么选股;如何从4000只股票中选股

  半岛体育平台新闻资讯     |      2024-06-16 00:32

  半岛全站那么多股票怎么选股;如何从4000只股票中选股多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出半岛全站

  举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。

  打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。

  多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。

  候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。

  例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。

  从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如 PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。

  同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。

  具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小, 按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。

  上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。

  不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除, 而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。

  冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余因子剔除步骤为:

  (1)先对不同因子下的n个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高

  (4)设定一个得分相关性阀值 MinScoreCorr,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子半岛全站,而因子则作为冗余因子剔除。

  综合评分模型选取去除冗余后的有效因子,在模型运行期的某个时间开始,例如每个月初,对市场中正常交易的个股计算每个因子的最新得分并按照一定的权重求得所有因子的平均分。最后,根据模型所得出的综合平均分对股票进行排序,然后根据需要选择排名靠前的股票。例如,选取得分最高的前20%股票,或者选取得分最高的 50 到 100 只股票等等。

  举个例子:可以构建一个多因子模型为(PE,PB,ROE),在月初的时候,对这几个因子进行打分,然后得分最高的50个股票作为投资组合,在下个月按照同样的方法进行轮换替换。持续一段时间后,考察该投资组合的收益率是否跑赢比较基准,这就是综合评分模型的建立和后验过程。

  当然这个例子是一个最简单的例子,实战中的模型可能会比较复杂,比如沃尔评分法就是一个复杂的多因子模型,它是对股票进行分行业比较,算出每个行业的得分高的组合,然后再组合成投资篮子。

  一方面,由于量化选股的方法是建立在市场无效或弱有效的前提之下,随着使用多因子选股模型的投资者数量的不断增加,有的因子会逐渐失效,而另一些新的因素可能被验证有效而加入到模型当中;另一方面,一些因子可能在过去的市场环境下比较有效,而随着市场风格的改变,这些因子可能短期内失效,而另外一些以前无效的因子会在当前市场环境下表现较好。

  另外,计算综合评分的过程中,各因子得分的权重设计、交易成本考虑和风险控制等都存在进一步改进的空间。因此在综合评分选股模型的使用过程中会对选用的因子、模型本身做持续的再评价和不断的改进以适应变化的市场环境。

  多因子的模型最重要是两个方面:一个是有效因子,另外一个是因子的参数。例如到底是PE有效还是ROE有效;到底是采用1个月做调仓周期还是3个月做调仓周期。这些因子和参数的获取只能通过历史数据回测来获得。但是在回测过程中,要注意,不能过度优化,否则结果可能反而会不好。

  市场上的投资者是有偏好的,有时候会偏好价值股,有时候偏好成长股,有时候偏好大盘股,有时候偏好小盘股。由于投资者的这种不同的交易行为,形成了市场风格,因此在投资中,利用市场风格的变化,进行轮动投资会比一直持有的效果好很多。

  投资风格是针对股票市场而言的,是指投资于某类具有共同收益特征或共同价格行为的股票,即某类投资风格很受欢迎,并且在某一个时间段内具有持续性和连续性(譬如,价值投资和成长型投资两种风格,或者大盘股和小盘股这两种风格总是轮流受到市场追捧).

  由于投资风格的存在,从而产生一种叫做风格动量的效应,即在过去较短时期内收益率较高的股票,未来的中短期收益也较高;相反,在过去较短时期内收益率较低的股票,在未来的中短期也将会持续其不好的表现。

  比如:在2009年是小盘股风格,小盘股持续跑赢沪深300指数;而在2011年,则是大盘股风格,大盘股跌幅远远小于沪深300指数。如果能事先通过一种模型判断未来的风格,进行风格轮动操作,则可以获得超额收益。

  晨星风格箱法是一个3×3矩阵,从大盘和小盘、价值型和成长型来对基金风格进行划分,介于大盘和小盘之间的为中盘,介于价值型和成长型之间的为混合型,共有9类风格。

  (1)规模指标:市值。通过比较基金持有股票的市值中值来划分,市值中值小于10 亿美元为小盘;大于50亿美元为大盘;10亿~50亿美元为中盘。

  (2)估值指标:平均市盈率、平均市净率。基金所持有股票的市盈率、市净率用基金投资于该股票的比例加权求平均,然后把两个加权平均指标和标普500成份股的市盈率、市净率的相对比值相加,对于标普500来说,这个比值和是2。如果最后所得比值和小于1.75,则为价值型;大于2.25为成长型;介于1.75~2.25之间为混合型。

  宏观经济表现强劲时,小市值公司有一个较好的发展环境,易于成长壮大,甚至还会有高于经济增速的表现,因此,小盘股表现突出的概率高于大盘股。而当经济走弱时,由于信心的匮乏和未来市场的不确定性,投资者可能会倾向于选择大盘股,起到防御作用,即使低通货膨胀、货币走强,也不足以冒险去选择小盘股。

  研究发现,经济名义增长率是用来解释规模效应市场周期的有力变量。当名义增长率提高时,小市值组合表现更优,因为小公司对宏观经济变动更为敏感,当工业生产率提高、通货膨胀率上升时,小公司成长更快。

  大小盘轮动最为投资者所熟知,本案例就A场的大小盘风格轮动进行实证研究,通过建立普通的多元回归模型来探寻A股的大/小盘轮动规律。

  1.大小盘风格轮动因子如下:(1)M2同比增速:M2同比增速为货币因素,表征市场流动性的强弱。当流动性趋于宽松时,小盘股相对而言更容易受到资金的追捧。

  (2)PPI同比增速:PPI反映生产环节价格水平,是衡量通胀水平的重要指标;且PPI 往往被看成CPI的先行指标。

  (3)大/小盘年化波动率之比的移动均值:波动率表征股票的波动程度,同时也在一定程度上反映投资者情绪;可以认为大/小盘年化波动率之比能够反映出一段时间内大/小盘风格市场情绪的孰强孰弱,而经过移动平滑处理后的数值则更加稳定。

  2.预测模型基于上面所讲的风格因子建立如下回归模型:D(Rt)=α+β1·MGt−1+β2·PGt−3+β3·σt−3+εt其中, D(Rt) 为当月小/大盘收益率差(对数收益率); MGt−1 为上月M2同比增速; PGt−3 为3个月前PPI同比增速; σt−3 为3个月前小/大盘年化波动率之比的移动平滑值; εt 为误差项。

  本案例采用滚动78个月的历史数据对模型进行回归,得到回归系数后对后一期的D(Rt)进行预测,由修正预测值的正负来进行大/小盘股的投资决策。数据预测期为2004年6月至2010年11月。

  在78个月的预测期中,准确预测的月数为42个月,准确率约为53.85%,并不十分理想。但值得一提的是,2009年10月至2010年12月,模型的预测效果非常好,

  若从2004年6月开始按照轮动策略进行投资,则截至2010年11月底轮动策略的累计收益率为307.16%,同期上证综指的收益率为81.26%,小盘组合的累计收益率为316.97%;轮动策略稍逊于小盘组合,但仍较大幅度地跑赢了市场指数。

  轮动策略在2007年的大牛市中能够很好地跟随大盘股的节奏,而在2009年以来的结构性行情中又能较好地捕捉小盘股的投资机会。

  若从2007年初开始采用轮动策略进行投资,则截至2010年11月底累计收益率可达458.65%,大幅超越同期上证综指及大、小盘组合的收益率。

  与风格轮动类似,行业轮动是另外一种市场短期趋势的表现形式。在一个完整的经济周期中,有些是先行行业,有些是跟随行业。例如,对某个地方基础设施的投资,钢铁、水泥、机械属于先导行业,投资完后会带来房地产、消费、文化行业的发展,这就属于跟随行业。研究在一个经济周期中的行业轮动顺序,从而在轮动开始前进行配置,在轮动结束后进行调整,则可以获取超额收益。

  国外许多实证研究表明,在环球资产配置中,行业配置对组合收益的贡献的重要性甚至超过了国家配置,而且认为行业配置的重要性在未来相当长一段时间内也将保持。行业轮动策略的有效性原因是,资产价格受到内在价值的影响,而内在价值则随着宏观经济因素变化而波动。

  研究表明,板块、行业轮动在机构投资者的交易中最为获利的盈利模式是基于行业层面进行周期性和防御性的轮动配置,这也是机构投资者最普遍采用的策略。此外,周期性股票在扩张性货币政策时期表现较好,而在紧缩环境下则支持非周期性行业。行业收益差在扩张性政策和紧缩性政策下具有显著的差异。

  在国内目前情况下,根据货币供应量的变化来判断货币政策周期,是一个不错的选择。而M2正是广义的货币,反映了社会总需求的变化和未来通货膨胀压力。M2同比增速则可以反映流通中的货币供应量变化,即货币政策效果的实际反应。因此,可以用M2来判断货币政策或者货币供应处于扩张还是紧缩的周期。

  为了将行业划分为周期性行业和非周期性行业,这里选取沪深300行业指数,并且以沪深300 指数作为市场组合,利用CAPM 模型计算行业的Beta值和均值方差。

  从Beta 值来对行业的周期性和非周期性进行区分,周期性行业有能源、材料、工业和金融;非周期性行业有可选、消费、信息、医药、电信和公用。

  (1)信息的同步性:考虑到M2 的披露时间及信息的传导时间,所有投资时段都滞后了一个月的时间。

  按照顺周期策略构建投资组合并查看组合的收益及对应的逆向投资(扩张时投资非周期性行业,紧缩时投资周期性行业,初始资金1000万)。

  从2007年6月至2011年12 月的策略收益来看,不考虑交易成本,顺周期行业轮动策略获得最高的累积收益(-19.65%)远胜于行业平均(-40.50%)和逆周期策略(-59.13%),逆周期策略表现最差。

  此期间业绩基准为沪深300 指数的收益为-37.57%,顺周期的行业轮动策略则战胜沪深300 指数达到17.92%,年化超额收益超过3.6%。即便扣除2%的单次换仓成本,行业轮动策略同样远远战胜同期沪深300 指数和行业平均投资策略的表现。

  该策略具有如下优点:理念容易理解,且符合自上而下的投资理念,适合机构投资者进行行业配置;将行业划分为周期性和非周期性进行投资,这种分类标准与实际投资中对行业属性的认识也非常接近,减少了对行业基本面和公司信息的依赖;在紧缩时由于选择投资于非周期性行业能够避免较大的不确定性,使得整个组合的风险大大降低,抗风险能力得到增强;依据货币供应增速M2进行轮动,使得策略具有较强的可操作性。

  在市场中,经常存在交易性机会,其中一个就是资金流模型,该模型使用资金流流向来判断股票在未来一段时间的涨跌情况,如果是资金流入的股票,则股价在未来一段时间将可能会上涨;如果是资金流出的股票,则股价在未来一段时间会可能下跌,那么,根据资金流向就可以构建相应的投资策略。

  基本概念资金流是一种反映股票供求关系的指标。传统的量价无法区分市场微观结构中的流动性和私有信息对股价的影响,而根据委托测算的资金流,能够有效地观察微观市场交易者的真实意图及对股价造成的影响。

  资金流定义如下:证券价格在约定的时间段中处于上升状态时产生的成交额是推动指数上涨的力量,这部分成交额被定义为资金流入;证券价格在约定的时间段中下跌时的成交额是推动指数下跌的力量,这部分成交额被定义为资金流出;若证券价格在约定的时间段前后没有发生变化,则这段时间中的成交额不计入资金流量。

  在非强势有效的A场,普遍存在信息不对称的问题。机构投资者与散户投资者在对同一信息的评估能力上存在差异。在大部分情况下,散户投资者缺乏专业的投资能力和精力,那么根据“搭便车”理论,希望借助机构投资者对股价的判断进行投资,一旦机构投资者率先对潜在市场信息做出反应,羊群效应的散户投资者则追涨杀跌,往往导致在很多情况下市场对潜在信息反应过度。这样根据逆向选择理论,能够准确评估信息价值的投资者便会对反应过度的股价做出交易,买入低估的、卖出高估的股票,从而纠正这种信息反应过度行为。

  根据市场对潜在信息反应过度的结论及市场投资者的行为特征,可以采取逆向选择模型理论来构建选股模型,即卖出前期资金流入、价格上涨的股票,买入前期资金流出、价格下跌的股票。按照这个思路,对一些指标参数进行回测分析,可以得到稳定的选股模型。

  根据资金流各种指标的特点,在选股模型中采用比较简单的方法,即以指标排序打分的方式来筛选股票。首先通过对各个资金流指标进行排序打分,然后将股票对各个指标的得分进行求和,最后以总得分值大小来筛选股票,具体步骤如下:

  (1)确定待选股票池。在选择组合构建时,剔除上市不满一个月的股票,剔除调仓期涨跌停及停牌的股票,防止因涨/跌停无法交易。剔除信息含量小于10%的股票,因为这部分股票信号不明显,无法取得有效信息。

  (2)构建股票组合。①指标打分:首先将待选股票池中的股票按照资金流指标进行排序,然后采用百分制整数打分法进行指标打分,即以股票在各个指标中所处位置的百分数作为股票对于该指标的得分,前1%得分为1,依次递减,最后1%得分为100。

  ②求和排序:将股票相对于各个指标的得分进行求和,将和值从小到大排序,进行分组比较;另外,选择排名靠前的N只股票构建组合。

  (3)组合定期调整,调整时间从1到3个月不等。持有到期后,利用更新后的指标数据重新确定待选股票池,重复步骤(2)打分求和过程,并将股票按照指标得分从小到达排序,将原来分组中跌出组合的股票剔除,调进新的股票,同时将新组合内样本股的权重调整到相等。

  (4)统计检验。分别计算各组合的收益率情况,考察组合的效果。本案例的结果来自于D-Alpha量化对冲交易系统的后验平台‘模拟交易所’,主要数据情况如下:(1)后验开始时间:2007-2-1,后验结束时间:2011-2-18。(2)股票池范围:沪深300成分股;全市场。(3)资金规模:现货1亿,3亿,10亿;期货:现货=1:1。(4)撮合规则:高频数据撮合,与交易所类似。

  A场存在显著的动量及反转效应,按照形成期为6个月持有期为9个月的动量策略以及形成期为2个月持有期为1个月的反转策略构建的投资组合表现最佳。从不同的市场阶段看,动量策略在熊市阶段表现优异,而反转策略则在牛市阶段可以取得出色的业绩。

  动量及反转效应:动量效应是指在一定时期内,如果某股票或者某股票组合在前一段时期表现较好,那么,下一段时期该股票或者股票投资组合仍将有良好表现。而反转效应则是指在一定时期内表现较差的股票在接下来的一段时期内有回复均值的需要,所以表现会较好。

  动量效应测试结果:从超额收益来看,形成期为4-9个月,持有期为6-10个月的动量组合可以取得较高的超额收益;从战胜基准的频率来看,形成期为6-8个月间,持有期为9-10个月的动量组合战胜基准的频率较高。综合来看,形成期为6个月,持有期为9个月的动量组合在整个样本内表现最佳。

  反转效应测试结果:从超额收益来看,形成期为1或2个月,持有期为1个月的反转组合可以取得较高的超额收益;从战胜基准的频率来看,短期组合,也即形成期和持有期都为1或2个月的反转组合战胜基准的频率较高。综合前面两个因素,形成期为2个月,持有期为1个月的反转组合在整个样本内表现最佳。

  动量策略表现:买入前6个月累计收益率最高的一组股票,并持有9个月的动量策略构建的投资组合在考虑单边0.25%的交易成本以后,在长达7年多的测试期中取得了226%的累计收益,远高于同期沪深300指数取得的117%的累计收益。在整个测试阶段,动量策略战胜基准的频率为58.43%。这一策略在熊市中表现尤为出色,相对于沪深300平均每个月可以取得1.2%左右的超额收益,信息比率为0.82,熊市阶段战胜基准的频率在65%以上。

  反转策略表现:买入前2个月内累计收益率最低的一组股票,并持有1个月的反转策略构建的投资组合在考虑单边0.25%的交易成本以后,在长达7年多的测试期中取得了261%的累计收益,远高于同期沪深300指数取得的117%的累计收益。在整个测试阶段,动量策略战胜基准的频率为51.69%。这一策略在牛市中表现尤为出色,相对于沪深300平均每个月可以取得接近1.5%的超额收益,信息比率为0.78,牛市阶段战胜基准的频率接近于57%。

  结论:A场存在显著的动量及反转效应。长期来看动量和反转策略相对于沪深300都可以取得超额收益,但是动量反转策略在不同的市场阶段表现不同,动量策略在熊市阶段表现优异,而反转策略则在牛市阶段可以取得出色的表现。因此在A场应用动量或者反转效应选择股票时,应根据市场环境在动量和反转策略间进行选择,牛市选择反转,熊市则选择动量。

  超一致预期能够带来超额收益。如果年报披露净利润大幅超预期,则可以年报公布之后买入持有获得超额收益。当然,如果在年报公布之前可以提前通过预测得知大幅超预期,则也可获得事件日前的正超额收益。但是少数年度的超预期带来的超额收益并不明显,可能对某些利用此原理进行事件驱动选股策略的收益有一定影响。

  预期基本面因子主要分为预期估值因子和预期成长因子。预期估值因子中的预期市盈率因子是长期有效的,测试时间区间内,年胜率100%,月胜率59.38%,日胜率52.92%。但是波动较大,回撤较大。而且在近两年采用该因子选股产生的超额收益远远小于前些年。

  通过对复合增长率和预期净利润同比两类预期成长类因子的研究,预期增长的组别的选股表现明显好于预期减速的组别。而且对预期增长的组别进一步分类,可以得到预期增速处于中等水平的股票在年报后表现更好更稳定的结论。

  最常见的预期情绪面因子如一致预期净利润变化率,净利润一致预期值的环比变动幅度,也就是指最近一期预期净利润被调高/调低的幅度。另外,我们还结合最近一期的涨跌幅构建预期净利润变化率衍生指标(最近一期预期净利润变化率除以最近一期涨幅)-预期净利润回报。构建的预期净利润回报因子的刻画作用明显优于预期净利润变化率因子。

  综合预期基本面因子和预期情绪面因子构建量化选股模型。 策略组合绩效总结:综合预期基本面因子和预期情绪面因子构建的策略组合,组合绩效中的各项指标明显好于各单因子选股策略组合。降低了回撤幅度,模拟组合的组合收益还有所提高。平均年化超额收益为15.41%,月度胜率为70.31%,年度胜率100%,超额收益最大回撤5.99%。

  衡量股票趋势的指标最重要的就是均线系统,因为它是应用最为广泛的趋势追踪指标,所以均线是不可或缺的,把它作为捕捉大盘主趋势的基石。但是纯粹的均线由于噪音等原因,使得经常会出现误操作半岛全站,需要进行更多的处理机制,包括极点、过滤微小波动、高低点比较策略、高低点突破策略、长波的保护机制、长均线的保护机制等概念和技术细节。

  股票价格的波动会让人感觉价格变化飘忽不定,很难把握。为了便于捕捉趋势,所以需要对价格走势曲线进行简化处理,这样可以借助于均线方法。将a个(a为模型参数)连续的交易日的收盘价取一个均值,形成MA(a),比如a为10,即10个交易日数据取一均值,那么就可以得到股价的10日均线U,完成对价格曲线的第一步简化。

  极点就是局部的高点或者低点,在极点处股价出现了转折,所以它们是记录股价变化的关键点,包含了比较多的信息。如果股价上涨至此,接下来又出现了下跌,那么就形成一个局部的高点;如果股价下跌至此,接下来又出现上涨,那么就形成一个低点。这些叫做极点,往往是股价变化的关键信息点,将它们记录下来,以备进一步制定策略。

  均线策略最大的优势跟踪趋势效果比较好,在形成趋势时能紧跟趋势,但是最大的问题在于碰到盘整行情,均线就摇摆不定,容易频繁地发出交易信号,所以必须对其进行进一步处理。

  可以结合记录的极点形成过滤微小波动的方法。当股价形成一个极点M后,接下来股价波动在M点股价的上下B个(B为模型参数)指数点内,就认为股价和M点相比没有变化,这样可以得到过滤了微小波动的均线趋势线W。