文 献 综 述
第一章 绪论
1.1研究背景
随着互联网技术的不断发展,社交网络以其快速便捷和互动式参与等特点越来越多地被改变着人们的生活习惯。投资者可以通过社交网络平台了解到相关的财经信息,发表自己对信息的看法和感知,在虚拟网络上和不同的人分享信息,如构建出一个社区一样,达到了信息的共享。社交网络平台也变为一个信息的发布地,聚焦地和放大渠道在信息传播和扩散中扮演着举足轻重的作用。在此基础上,不断扩大的海量信息资源也从另一方面影响着投资者的决策,市场分析者的判断等等。社交媒体发出的财经信息品种多样涉及上市公司的新产品、技术、服务的推出与研发;并购重组、公司债券发行,公司财报公布,股价变化,管理层变动等多种方面。已经有研究证实资讯对投资者选择投资品种和投资实际,市场分析者分析股票价格走势起到了非常重要的辅助和指引作用。因而针对社交网络不同类型财经信息对股票价格走势印象和股票收益就显得尤为重要。
本文拟采用深度学习以及SOAR模型的方法,试图探索一种能够在金融事件发生后,快速定位追踪不同媒介上网民情感变化的方法,并将情感的演变与受影响股票股价之间的关联关系表示出来,以期能够快速预防处理类似金融事件产生的负面效应,同时也为投资者投资决策提供相应的参考。
1.2存在的问题
- 金融文本难以被计算机识别。
互联网技术的快速发展虽然给人类的生活提供了巨大的便利,但是问题也随之而来。尽管目前自然语言处理的相关技术发展迅速,但是对计算机而言,文本的内容和含义仍然是是难以识别理解的,尤其是针对金融行业而言,缺乏一套完整的词义词典,不同于自然语言的专有词汇给文本处理带来了较大困难。采用传统的自然语言处理方式在效率以及准确率方面都很难达到我们的预期。
- 热点金融事件不容易发现与提取。
目前主流的事件抽取的方法主要可以归纳为两大类,分别是基于模式匹配的方法和基于机器学习的方法。基于模式的事件抽取方法的精度较高,但可移植性相对较差。如果更换了领域或者事件的主体发生变更,就会出现模式匹配率迅速下降的情况,同时较低的召回率也是基于模式匹配的事件抽取算法的缺陷。基于机器学习的事件抽取方法近年来得到广泛使用,但是特征选取不准确的缺陷依然存在。目前金融领域的热点事件的发现技术仍然不够成熟,上述两种方式都有自己的缺点,无法在短时间内发现热点事件,并持续跟踪给出相应的预判。
(3)网民情感被忽视,没有体现出投资市场中真正lsquo;主角rsquo;的作用,舆情价值没有得到充分体现。
目前我国的证券市场还处于一个新兴和不断发展的过程中,个人投资者所占比例依旧是最大的。在海量信息分享的环境中,个人投资者对不同类型信息的偏好和感知程度,极大地影响了投资者本人的投资策略,产生投机效应和弱有效的市场。如何引导投资者分辨社交媒体中不同类型的财经信息,正确地衡量和定性定量分析,将有助于建立有效的股票市场;同时挖掘出社交媒体财经信息的预测功能,也有利于市场分析者和投资人对未来走势的判断,取之于信息并且用之于预测,也为今后计算实验金融 Agent 个体具体接受信息的设定做了理论和实证的铺垫。而目前,金融舆情信息中,往往包含一些较为重要的金融事件,这些金融事件往往是网民情感集中爆发的关键点。如何从这些事件发生前后的网民情感走向来挖掘网民的情感转移规则,并将其用于预测分析相似事件下相关股票的走势,是本文重点研究的内容之一。
(4)相关系统的开发不够成熟,主要体现在用户体验较差,功能不够深入。
目前针对股票市场的研究较多,配套的网站系统也各种各样,但是这些系统往往需要付费,且功能太过肤浅,不具有参考性。本文拟配套一个完整的金融分析系统,用于金融舆情的获取、分析、股市信息的展示以及预测推理等。
