股票数据猫 | 股票量化数据

入门:石婆婆石公公量化系统——基本概念

root|2015-10-21 19:45:58

 股票数据猫 2015/10/21

 

声明:石婆婆石公公量化系统是新浪微博博主石婆婆石公公独自研发和运行的股票和期货量化分析系统,该系统的功能仅限于股市期货的学术研究目的,不构成股市和期货任何投资建议。石婆婆石公公拥有该系统以及该系统所产生的数据的完全权益。博主石婆婆石公公承诺,其在新浪微博上公开的数据可以免费使用和传播。石婆婆石公公声明本人力求但不保证所有数据的正确、完整和及时。博主石婆婆石公公提示该系统所提供的数据仅限研究使用。若使用者将本系统应用于投资,产生的风险自负。

微博的长博文说过。

本系统最基本的五大参数——强度、转折、资金、预期、风险。石婆婆石公公量化系统开发之目的在于将复杂的投资系统简化,用数量以及数量级别来表述股票在整体市场中的位置和属性。本系统最主要的参数为五类:强度、转折、资金、预期、风险。这五大参数分为1-11级别。通过级别将市场中所有的板块和个股进行分级。除了第6级别外,其余级别为200个左右的股票。也就是说,强度级别为3级的股票有200个。

    

1.       强度

强度值是股票在市场中的强弱。股票持续走强,强度值就高;反之强度值就低。具体计算时,将近3千多种股票按由强到弱度排序,前200名为11级,依次为10级、9级,最弱的为第1级。

我们平时说“强者恒强,弱者恒弱”。从统计上看真的如此吗?下表618日的统计数据。表中说的是什么?我详细道来:我们将股票分为三组,强势股11-9级、中势股8-5级、弱势股4-1级。我们统计这三组股票在后一个交易日涨跌幅榜的比例。高级别的股票进入涨幅榜前300名的可能性为29%;低级别4-1级进入涨幅榜的可能性为4%。也就说强势股比选弱势股的机会多6倍以上。不过,从历史数据看没那么夸张,历史数据为17%9%,多一倍。也说明强者还是机会多一倍。

强度

11-9

8-5

4-1

占涨幅前300比

29%

10%

4%

历史统计数据

17%

12%

9%

占跌幅前300比

11%

9%

21%

历史统计数据

19%

12%

8%

同样对照这些数据,你也可以看出弱者未必一定弱。倒是强者是一张双刃剑。可以涨上去很厉害,有可能跌来更厉害。

这就是我们说的股票的强弱。

实际上,比这个复杂。我们知道历史数据一般稳定。具体到每一日股票强弱的表现,情况非常复杂。强势股可能集体大溃败,弱势股可能集体造反。而这些变化,往往意味着股市大势的变局要发生。

一般来说,股市处在稳定态时,买强度级别高的股票机会多一些,特别是那些刚刚从中等强度变为高强度的股票机会多一些。如果一个股票长期高级别,也意味着物极必反要发生。

一般来说,弱势股随大势随波逐流,涨跌幅都不大,抗张也抗跌,没有人愿意光顾。有时,这样的股票忽然旱地拔葱,变成了强势,其背后要么有消息支持,要么条件不成熟只是短炒;有时,弱势股被打压,这也是违反常理的,背后的逻辑更是复杂,肯定是有预谋。618日,也就发生了这样情况。19日就大跳水了。

当然,如果把一个板块或者一个股票的强弱度动态地进行观察,分析强度值历史变化,最后所得的结论,其参考意义更为强大。

数据只是提供给有思考的人的。没有思考,数据没用。没有数据,思考起来心里不踏实。

强度值是一个短线指标。强度级别越高,作用周期越短;强度级别低,作用周期长。

2.       转折

转折值是股票在未来一段时期转好或者转坏的可能性。这一指标评价评价股票向上或者向下的趋势。转折值高,意味着转好,股票突破盘局向上的可能性大;转折值低,意味着转差,股票反转向下的可能性大。具体计算时,将近3千多种股票按由按照转好和转坏的可能性排序,前200名为11级,依次为10级、9级,最弱的为第1级。

需要说明的转折是一个中期指标。也就是说,转好或者转坏未必立即发生。转好了,可能直接走波段上涨,也有可能掉头下跌;转坏了,有可能接着上涨,有可能直接掉头跌下来。从滞后期的长短是否可以判断主力对股票的把控程度?

图中的数据是616日盘中统计的。显然转好级别高的股票比级别低的股票就会少多。就当天来说转好的股票立即上涨,显示资金急不可待。

转折

11-9

8-5

4-1

占涨幅前300比

17%

12%

10%

历史统计数据

13%

13%

11%

占跌幅前300比

12%

13%

12%

历史统计数据

13%

12%

12%

一般来说,应该选择近期转折级别高的股票,回避转折级别低的股票。对于转折级别低的股票,如果价位合适,长期盘整,可以考虑逢低介入等待。相信不会久等的。对高位的股票,即便是连续上涨,只要转折级别低,就应该保持警惕。这样的股票,不鼓励大量买入,而随时准备逃跑。

3.       资金

资金值是股票在过去一段时期资金流入或流出的强度。具体计算时,将近3千多种股票按由按照资金流入或流出的强度进行排序,前200名为11级,依次为10级、9级,最弱的为第1级。

资金对股票的影响不言而喻。只要有资金持续流入,股票总归有行情,不可能没有。资金流入的背后一定有秘密不为一般人知晓。主力或神秘资金不会无缘无故地青睐某一只股票或者板块。他们也不会随便地放弃任何一次做多的机会。只是资金的流动虚虚实实、真真假假很难监控。我的资金监控模型一直是比较近似地追踪主力动向。个人认为,系统的资金值有一定准确性,但不是绝对准确。

图中反应616日资金值对股价的影响。

资金

11-9

8-5

4-1

占涨幅前300比

20%

11%

11%

历史统计数据

17%

12%

9%

占跌幅前300的比

19%

13%

9%

历史统计数据

16%

12%

10%

显然,选择资金值高级别的比低级别的机会要多一倍。(20%11%;历史均值17%9%)。多一倍意味着什么?你懂的!有说明我的资金模型非常有用。

资金值就可以作为短线指标,也可以作为长线指标。

资金值的应用非常广泛。比如:有些股票在低位,强度级别一直低,资金级别一直居高,估计一直不见涨甚至跌,那么这样的股票是大牛的可能性一定很大,你可以长期潜伏,当然要是转折值抬头后潜伏,不是更有效率?这样的股票,你拿着就别轻易被振下来,可以有信心的做T,从头吃到尾。

资金级别为表中的第三列。这个资金是长期资金的级别,有时反应短期资金的变化不敏感,因此量化系统增加了两列近期资金值,第七列近期资金,反应的是近60日资金的情况,这个数值是相对值,代表强度,没有分1-11级;第八列近期资金A,表示的最近16日资金流入或流出的次数,正数是流入,负数是流出,2.5表示流入3次,0.5表示当日是流出的。

有很多主力喜欢做短线,近期资金对短炒十分有用。数值大,表示炒高机会大。

也有一种情况很普遍,资金持续流出,资金级别变得越来越不好,股价却很疯狂,该怎么判断?这样的股票基本上就是主力不计后果的拉升派发。因此,不主张大量进入这样的股票,但,如果已经持有,就享受着拉升的同时,准备开溜。

注意,有些板块、全部的期货、港股、美股的量化数据中的资金级别无效。原因是没有原始数据。这些投资品种,有资金数据,也不要看了。

4.       预期

预期值是股票在未来一段时期内的走势。具体计算时,先计算将近3千多种股票未来10日,20日,40日,80日的涨跌幅,然后在进行综合评价,按照预期的涨幅从高到低进行排序,前200名为11级,依次为10级、9级,最弱的为第1级。

预期是对未来的股价的判断,因此,具有很大的不确定性。说到预期,天下没有一成不变的预期,预期总是不断变化之中的,就好比天气预报,可以相信十分地信任它,但它也是经常出错的。

量化系统中预期有两列数字,一列是第四列短预期,一列是第六列长预期。我们一般所讲的预期是长预期,对应的短预期数值只是参考。

本系统的预期功能非常强大,很容易让人看糊涂。长预期值分为1-11级,这样的简化使得看起来、比较起来更容易。下图是612日收盘的体检结果。可以看出从历史统计数据看预期级别高的就会稍高于级别低的(13%11%)。

预期

11-9

8-5

4-1

占涨幅前300比

15%

12%

11%

历史统计数据

13%

13%

11%

占跌幅前300比

13%

11%

15%

历史统计数据

13%

13%

11%

预期指标是一个短、中、长指标。这样说是因为系统提供的预期数据非常强大。提供了未来10日,20日,40日,80日的预期涨跌幅。也就是下表创业板综最近几天的预期。

这个表还是有点复杂,需要看仔细点,习惯了就很简单。要是怕麻烦就看不到好东西。

先看第4-7列。说的是未来10天的预测,预测的是未来10日的最大涨幅。第5列为35%,说明未来10日创业板综最大涨幅超过10%可能性为41%,当然是与昨日收盘价相比;第6列说的是未来10日创业板综最大涨幅超过15%可能性为25%;第7列说的是未来10日创业板综最大涨幅超过30%可能性为6%;综合看未来10日最大涨幅的平均值为第四列的11.1%。很简单吧!没有那么复杂。大家应该想到,数据是没有定数的,给的是一个概率。就好比两个球队比赛,比赛前任何预测都是一个概率,没有定数。说到选股,从数据看,数值越大越好:特别是第四列数值大,肯定机会多;第七列涨30%的概率大,肯定爆发性强。

同样的9-12列。说的是未来10天的最大跌幅的预测。就不多讲了。肯定的应该选择数值越小越好:特别是第九列数值小,跌的机会小;第十二列跌30%的概率小,肯定爆跌可能性小,反之,就得小心暴跌了。

有朋友想如果我们把最大涨幅的平均值(第四列)减去最大跌幅的平均值(第9列),是不是可以判断一下涨跌平衡后的结果,其实这样的算法很直观,但不科学。表中第十四列正是如此计算的结果。显然这个数值越大越好,越大表明涨比跌幅度大。

还有朋友想,我们把最大涨幅的平均值(第四列)除以最大跌幅的平均值(第9列),得到一个涨与跌的比值,是不是更容易用于选股?其实这样的算法很直观,也科学。表中第十八列正是如此计算的结果。这个比值大,也就意味着你承担着同样的下跌风险,收获却大得多。

上面的说明,把10日的预期基本上说完了。那么20日,40日,80日的数据在哪里?这样的数据很多,无法一一贴出来。要不表格大的惊人。给出的数据中的14-17列,分别是10日、20日、40日、80日最大涨幅与最大跌幅的差;18-21列,分别是10日、20日、40日、80日最大涨幅与最大跌幅的比值。这个数值一样是越大越好。道理与上面说的一样。

信息量有些的大了。不喜欢数学的人,看了数字就头大头疼,钱上的数字是例外的。

最后说两点,就结束。要不有些人受不了。

既然是预测,就有可靠性,第三列的样本数可以看作是可靠性。样本数越大,说明这条路走过的人越多,预测结果越可靠;样本为3以上就可以了。样本为1或者2,说明这条路走的人很少,其中的问题未必被发现,对预测的结果还是小心点。样本数为0,也还得预测啊。只是结果怎么样,天知道!这样的结果,未必一定很好,一定很坏。

还有更绝的,所有的结果为0,那么说明系统根本不想算了。是好是坏,天知道。系统告诉你,它不知道!

 

5.       风险

风险值是预测股票的风险大小。具体计算时,先计算3千多种股票下跌风险,然后从高到低进行排序,前200名为11级,依次为10级、9级,最弱的为第1级。

11级风险最高,1级最低。11级未必一定下跌,但小心为上,需要随时保持跑路的姿势。

 

6.       综合

综合值是将几大参数进行综合评价后,进行由高到低的排序。11级最高,1级最低。综合级别用于选股还是有一定的参考价值。不过这个数值有效期只有一天。比较合适超级短线。它本身风险也不低。即便是第11级,经常大涨大跌,不容易把握。

7.       最后

本系统面前也就是这些参数值相互组合着。参数组合起来,情况就复杂得多。毕竟数据是计算出来的,具有客观性。利用数据来解读股市,总比张嘴凭想象好一点点,但也不是万能的。其中技巧也还是需要多总结。盘中经常会提供一种体检表,如下图。 这个表格也很重要,基本上能反映各个参数的历史表现和现实表现。表中的部分已经说过。我们盘中经常看看这个表格,就知道各个参数的具体表现。毕竟各个参数的表现不是一成不变的,特别是在股市变盘中,很多参数的作用是反着的。换句说,如果有些参数反常了,就得小心变盘。变盘怕什么?要么变坏,要么变好。就好比在革命的年代或者是改革年代,好人坏人常常是反着来看的。

关于基础部分,就说这么多了。大家可以留言,这样,有机会我再补充。总之,为大家服务,好事情!

_____________________________________________________________________________

 

下面是网站的介绍,比较简单。

_____________________________________________________________________________

强度

强度指标衡量股票在市场中的强弱。共分11级。具体来说,将市场中全部的股票按强弱进行排队,最强的200个股票为第11级,其次是10级和9级,最弱的为1级。9-11级为强势股,1-4级为弱势股。

都想预测哪些股票强势,都想拿着强势股票,都想跟着强庄,要赚钱,就要强势。看准了强势股,踏准了强势的脚步,不是梦想,关键在于把握强势之规律:“强者恒强”,“弱极必反”,“强中自有强中强”

 

资金

资金是衡量个股资金进出的情况。共分11级。具体来说,将市场中全部的股票按资金进入和流出的情况进行排队,资金面最好的200个股票为第11级,其次是10级和9级,最弱的为1级。9-11级为资入股,1-4级为资出股。

主力介入一只股票,或潜伏,或拉升,或出货,体现得最具体的就是资金动向。洞察了资金的流动,就等于透视了主力的动机。所以资金的量化最难把握,也是最核心的内容。

系统另外设立近期资金和近期资金A,作为判断资金的辅助指标。

 

预期

预期是预测个股未来的涨跌幅的情况。共分11级。具体来说,预测股票未来10日,20日,40日和80日内可能到达的最大涨幅、最大跌幅、平均值以及概率,然后综合上述数值将市场中全部的股票预期情况进行排队,预期最好的200个股票为第11级,其次是10级和9级,最差的为1级。9-11级为预高股,1-4级为预低股。

预测从来都是概率事件。做最好的期望,做最坏的准备。尽管如此,选择股票,自然会选择预期良好的股票,规避差预期股。

 

转折

转折是判断股票转好或者转坏的临界情况,是一种潜在的反转信号。共分11级。具体来说,预测股票忽然加速上涨或者下跌的可能性,将市场中全部的股票按可能性进行排队,向上突破可能性最大的200个股票为第11级,其次是10级和9级,最差的为1级。9-11级为转好股,1-4级为转差股。

转折就是机遇。把握了这个时机就可能恰到好处地跟风和逃离。转折是一个先行指标。

 

风险

风险是判断股票面临的潜在危机情况,是一种控制信号。共分11级。设计这个参数的指标、数据尽可能地独立于其它子系统,使得风险参数起着独立地监控作用。具体说,按照个股潜在的风险,将市场中全部的股票进行排队,风险最大的200个股票为第11级,其次是10级和9级,最差的为1级。9-11级为高风险股,1-4级为低风险股。

风险的作用在于控制。

 

综合

综合是将多种参数合起来进行评价的结果,是一种总体评价。共分11级。设计这个参数的目的是选股傻瓜化,类似于卡片机。具体说,综合考核市场中全部的股票,进行排队,综合值最高的200个股票为第11级,其次是10级和9级,最差的为1级。一般来说,买入9-11级的股票机会多一些,买入1-4级机会少一些。

综合的作用在于傻瓜式选股,有水平的摄影师是玩单反的。

智能综合

智能综合是将近百种参数合起来,采用人工智能评价的结果,也是一种总体评价。共分11级。设计这个参数的目的是才用人工智能、大数据选股傻瓜化。具体说,自动根据市场动态的情况,计算个参数对股价上涨下跌的影响,依次对市场中全部的股票进行排队,综合值最高的200个股票为第11级,其次是10级和9级,最差的为1级。一般来说,买入9-11级的股票机会多一些,买入1-4级机会少一些。

智能综合的作用在于精准式选股。

blob.png




淘宝手机新用户注册,领取新人奖188元