如何利用雪球、微博等平台的炒股大V,打造赚钱机器

6,419 阅读8分钟

由于之前处理过用户评论的情感分析,又研究过一点点量化投资,所以,最近突发奇想了一个投资策略。虽然还没有进行实践,但从逻辑推导上来看,还是非常自恰的。

我想通过本文和大家分享一下这个投资策略,提供给大家一个炒股的新视角。同时,也希望得到大家的意见和反馈,来弥补盲区。

中国股市是一个散户居多的市场,很容易受到消息和情绪的影响,会直接反映在股价的涨跌上,一个利好的消息,很可能快速拉升一只股票,而一个利空的消息,就很可能导致快速下跌,即追涨杀跌

割韭菜

而这类利好消息的源头是如何传播出去的呢?

  • 首先,上市公司披露的公告和财务报表是最真实、最稳定的信息源。
  • 其次,各个投资机构的分析报告,虽然非常有效,但散户极难获取。
  • 最后,众多的投资领域的意见领袖(大V),所发表的文章、短讯等。

散户想要读懂上市公司的公告和财报,是非常困难的,需要很强的财务专业知识,而且还需要花费大量的时间和精力。所以,只有极少数的散户会自己阅读公司的财报,来进行投资决策。

对于普通的散户来讲,投资机构的分析报告,既不容易获得,又晦涩难懂。因此,这条信息通路也被阻断了。

综上所述,散户获取消息的最常见方式,就是通过关注大V,阅读TA们的文章和短讯,来对股票进行判断和投资。同时,大V之所以被称之为大V,必定有其专业性,或熟悉行业,或了解财报等。

那么,可想而知,大V们的投资建议,一定会影响到广大散户的投资决策,也就会有一个中短期的、较确定的收益预期。

然而,这样的收益预期对于普通的散户来说,存在两个问题:

  1. 信息的延迟,信息在社交网络中传播,是有延迟的。同一个消息,并不是所有散户都能在同一时间内阅读,一定存在时差。
  2. 信息的冲突,同样的一个消息,不同的大V可能会有完全不同的解读,这就会导致冲突,让散户做出不同的抉择。

这两个问题会产生一定程度的信息差,也就孕育出了投机的机会。如果我们能够开发一个系统,领先绝大多数散户,优先分析好大V们的数据,并提前进场,那么就可以享受到信息差带来的红利。

关于这个量化策略的具体步骤,我大体整理了一下:

1. 通过雪球、微博、微信、知乎等平台,收集投资领域的大V

在综合类的社区里,一定会有许多聊股票的大V存在,我们可以通过微博、微信公众号、知乎等平台找到TA们,并记录下TA们的用户信息(用户名、用户ID)。

而雪球作为一个关于股票投资领域的垂直社区,更是值得我们重点关注。

我们可以制定一个标准,为不同的平台、不同的大V分配不同的权重,以便更准确地衡量其影响力,比如:粉丝数、互动数、发文频率等。

这样,我们就有了一个带权重的大V列表,作为我们爬取的目标。

2. 定时爬取大V的文章、短讯等信息

如果对应的平台提供了相关的API接口,哪怕是付费的,最好也是使用API接口,主要是因为其稳定性有保障,避免爬虫被屏蔽或失效,毕竟这是涉及到量化投资的,对及时性、稳定性要求极高。

这样,我们就可以完成大规模、高效率的数据采集,在第一时间获得各个大V的第一手信息,要远远领先于绝大多数的散户。

3. 分析文本里的股票涨跌

虽然这里分析的是股票涨跌,但原理与文本的情感分析是相同的。我之前写过一篇介绍情感分析的文章,《浅谈如何做情感分析》,里面讲解了做情感分析的方法,大家可以看一看。

我们需要两份词典数据,分别是:

  • 股票名称及代码词典
  • 看涨看跌的相关词汇

股票名称及代码

通过股票名称或股票代码,来帮助我们筛选出讨论股票的文本片段出来,屏蔽掉一些无关的信息,比如:大V的日常、生活感悟等。

而且,还可以让量化交易系统聚焦到具体的某只股票,并自动化完成后续的交易操作。

需要特别注意的是:需要对股票名称进行统一化,因为很多股票都有多个不同的叫法,比如:茅台、贵州茅台等。这样可以最大限度匹配上正确的股票,避免遗漏。

看涨看跌词汇

这与情感分析的情感词很类似,都是用来表达对于某件事物态度的词汇。而股票的看涨看跌会有一些自己特有的词汇,需要我们人工进行整理,这里举一些简单的例子:

看涨的词汇:

  • 利好
  • 红利
  • 价值洼地

看跌的词汇:

  • 利空
  • 空头
  • 高估

我们还可以为这些词汇分配一个权重,以衡量其折射出的“情感”程度,能更准确地对涨跌进行预测。

有了这两份词典之后,就涉及到了文本的分词,并且分词的好坏直接影响着最后的分析效果,是非常重要的一环。之前我写过一本掘金小册《深入理解NLP的中文分词:从原理到实践》,里面详细讲解了NLP的中文分词技术,可以看一看。

此时,我们就可以提取出文本中所涉及的股票,并综合各个大V的看法,生成一份后市看涨的股票名单。同时,还可以设置一个阈值,只保留那些把握更大的、更多大V看好的股票。

4. 回测、模拟盘测试

虽然我们已经有了后市看涨的股票名单,但也不要急于投资,毕竟是涉及到真金白银,还是要非常谨慎的。

现在,有很多量化交易的平台提供了回测的功能。所以,我们可以使用大V的历史数据,并结合历史交易数据进行回测,来看看我们的策略是否有效,并且可以有效发现分析中存在的问题。

回测的时候,我们还需要一些其它的投资策略,要做好资金管理,也要设置好止损点和止盈点,因为不可能保证每一次都一定涨,只是看涨的概率要远大于看跌的概率而已,所以,需要承受一定的回撤风险。

如果一切顺利的话,那么就可以在模拟盘进行测试了,也就是同步的实时交易,以保证策略的时效性。

回测就好比互联网公司的仿真环境,由内部测试人员进行测试,而模拟盘测试就是小流量测试。

5. 上线量化交易策略

由于人会受到心理作用的影响,比如:恐惧、贪婪、损失厌恶、侥幸心理等等。所以,一旦证明了策略的有效性之后,就需要大胆地将交易操作交给机器去完成。

而我们最主要的是做好资金管理,并在策略超过有效期之后,再对策略进行评估、优化。

这一点十分重要,很多人投资股票失败,都是因为受情绪的影响太大,而我们的这个策略,恰恰是利用了这一点。

总结

通过这个量化策略的脑洞,会发现NLP的情感分析,去可以做很多事情,比如:追求女神或男神时,可以分析TA的微博、微信,及时分析出TA什么时候,容易情绪低落,需要人安慰。

很多时候,技术赋能就会形成降维打击,对于普通人来讲,几乎没有任何反抗的机会。所以,我们要想成为游戏规则的制定者,就需要不断提升自己,完成蜕变。

最后,安利大家一本掘金小册《深入理解NLP的中文分词:从原理到实践》,让你从零掌握中文分词技术,踏入NLP的大门。

如果因为以上内容对你所帮助,请帮忙点个赞、评个论、转个发,多谢多谢!