当前位置:首页 » 股票盈亏 » 拟合股票价格走势
扩展阅读
设计总院股票历史股价 2023-08-31 22:08:17
股票开通otc有风险吗 2023-08-31 22:03:12
短线买股票一天最好时间 2023-08-31 22:02:59

拟合股票价格走势

发布时间: 2022-12-23 10:42:08

Ⅰ 股票价格的随机游走的含义

随机游走模型的提出是与证券价格的变动模式紧密联系在一起的。最早使用统计方法分析收益率的着作是在 1900年由路易·巴舍利耶(Louis Bachelier)发表的,他把用于分析赌博的方法用于股票、债券、期货和期权。在巴舍利耶的论文中,其具有开拓性的贡献就在于认识到随机游走过程是布 朗运动。1953年,英国统计学家肯德尔在应用时间序列分析研究股票价格波动并试图得出股票价格波动的模式时,得到了一个令人大感意外的结论:股票价格没 有任何规律可寻,它就象“一个醉汉走步一样,几乎宛若机会之魔每周仍出一个随机数字,把它加在目前的价格上,以此决定下一周的价格。”即股价遵循的是随机 游走规律。
这也跟市场有效原则有关
弱有效证券市场是指证券价格能够充分反映价格历史序列中包含的所有信息,如有关证券的价格、交易量等。如果这些历史信息对证券价格变动都不会产生任何影响,则意味着证券市场达到了弱有效。

Ⅱ 实际波动率的概念

要明确实际波动率,首先要从波动率的概念入手。波动率(Volatility):是指关于资产未来价格不确定性的度量。它通常用资产回报率的标准差来衡量。也可以指某一证券的一年最高价减去最低价的值再除以最低价所得到的比率。业内将波动率定义为价格比率自然对数的标准差。波动率的种类有:实际波动率,隐含波动率,历史波动率等等,实际波动率便是波动率的一种。

Ⅲ 常用的趋势指标有哪些

趋势指标有很多种:
1、MACD称为指数平滑异同移动平均线,是从双移动平均线发展而来的,由快的移动平均线减去慢的移动平均线,MACD的意义和双移动平均线基本相同,但阅读起来更方便。当MACD以大角度变化,表示快的移动平均线和慢的移动平均线的差距非常迅速的拉开,代表了一个市场大趋势的转变。当MACD从负数转向正数,是买的信号。当MACD从正数转向负数,是卖的信号。
2、DMI指标是通过分析股票价格在涨跌过程中买卖双方力量均衡点的变化情况,即多空双方的力量的变化受价格波动的影响而发生由均衡到失衡的循环过程,从而提供对趋势判断依据的一种技术指标。
基本原理:在于寻找股票价格涨跌过程中,股价借以创新高价或新低价的功能,研判多空力量,进而寻求买卖双方的均衡点及股价在双方互动下波动的循环过程。
3、DMA指标又叫平行线差指标,是目前股市分析技术指标中的一种中短期指标,它常用于大盘指数和个股的研判。
基本原理:属于趋向类指标,也是一种趋势分析指标。DMA是依据快慢两条移动平均线的差值情况来分析价格趋势的一种技术分析指标。它主要通过计算两条基准周期不同的移动平均线的差值,来判断当前买入卖出的能量的大小和未来价格走势的趋势。
4、 EXPMA指标简称EMA,指数平均数指标或指数平滑移动平均线,是一种中线趋向类指标,不适合做短线分析。除了牛皮市,EXPMA的趋势性一般很明确。
从统计学的观点来看,只有把移动平均线(MA)绘制在价格时间跨度的中点,才能够正确地反映价格的运动趋势,但这会使信号在时间上滞后,而EXPMA指标是对移动平均线的弥补。EXPMA指标由于其计算公式中着重考虑了价格当天(当期)行情的权重,因此在使用中可克服MACD等其他指标信号对于价格走势的滞后性,同时也在一定程度中消除了DMA指标在某些时候,对于价格走势所产生的信号提前性,是一个非常有效的分析指标。
5、TRIX指三重指数平滑移动平均线
属于长线指标。它过滤掉许多不必要的波动来反映股价的长期波动趋势。TRIX这个指标把均线的数值再一次地算出平均数,并在此基础上算出第三重的平均数。较为有效地避免频繁出现交叉信号。
6、布林线指标,即BOLL指标,是用该指标的创立人约翰·布林格(John Bollinger)的姓来命名的,是研判股价运动趋势的一种中长期技术分析工具。
其利用统计原理,求出股价的标准差及其信赖区间,从而确定股价的波动范围及未来走势,利用波带显示股价的安全高低价位,因而也被称为布林带。其上下限范围不固定,随股价的滚动而变化。和麦克指标MIKE一样同属路径指标,股价波动在上限和下限的区间之内,这条带状区的宽窄,随着股价波动幅度的大小而变化,股价加大时,带状区变宽,狭小盘整时,带状区则变窄。
7、麦克指标又叫MIKE指标,其英文全称是“Mike Base”,是一种专门研究股价各种压力和支撑的中长期技术分析工具。
该指标是一种随股价波动幅度大小而变动的压力支撑指标,股价上方的压力称为“上限”,股价下方的支撑称为“下限”。第一条“上限”和第一条“下限”之间,我们设一条假想的中界线,股价位于中界线的上方时,参考“上限”压力值;股价位于中界线下方面,则参考“下限”支撑值

Ⅳ 内在市盈率的计算公式是什么

说到这个市盈率,人们是又爱它又恨它,有人认为有用,也认为无用。那么对于这个市盈率是否有用,该如何去用?

在和大家一起讨论如何使用市盈率去购买股票之前,先给大家介绍机构近期非常值得关注的三只牛股名单,时刻都可能被删除,还是应该越快领取越好:【绝密】机构推荐的牛股名单泄露,限时速领!!!

一、市盈率是什么意思?

我们通常理解的市盈率就是股票的市价除以每股收益的比率,它充分的反映了一笔投资,从开始投资到回本所需要的具体时间。

可以像这样去计算:市盈率=每股价格(P)/每股收益(E)=公司市值/净利润

就好像,例如估计20元股价的某家上市公司,此时你买入成本便为20元,过去一年每股收益5元,此时此刻20/5=4倍就是现在的市盈率。意思是公司需要4年的时间去赚回你投入的钱。

市盈率就是越低越好,投资时的价值就越大?这种说法是不正确的,我们不能将市盈率就这么直接拿来用,为什么会这么认为,那么下面具体来说一说~

二、市盈率高好还是低好?多少为合理?

由于行业不同,就导致这个市盈率有所区别,传统的行业发展潜力会有一定的限制,市盈率不是很高,但高新企业的发展方向是非常的好,投资者就会给予很高的估值,因此,市盈率就会较高。

那又有朋友说,哪些股票具有发展潜力还需要我们去了解?我熬夜准备了一份股票名单是各行业的龙头股,正确的选股方法是选头部,排名会自动更新,小伙伴们先领了再谈:【吐血整理】各大行业龙头股票一览表,建议收藏!

那多少市盈率才合理?上面也说到每个行业每个公司的特性不同,关于市盈率多少这个问题不好说的。我们还是能够继续用市盈率,还是非常不错的,这样一来给股票投资者做了一个极好的参考。

三、要怎么运用市盈率?

通常情况下,使用市盈率有三种方法:一是探讨该公司的历史市盈率;第二个方法就是,将这家公司和同业公司市盈率、行业平均市盈率进行比较;三用来分析这家公司的净利润构成。

要是你认为自己来研究很麻烦的,免费的诊股平台这里有一个,把以上三种方法作为依据,给你剖析你的股票是估高了还是估低了,如果您想得到一份完整的诊股报告,只需要输入您的股票代码即可:【免费】测一测你的股票是高估还是低估?

相对而言,我认为第一种方法最为实用,由于考虑篇幅原因,这里就跟大家说下第一种方法。

我们不难发现,股票的价格像浮萍、波浪一般漂浮不定,难以预料,没有什么股票价格是一直涨的,同样的,我们发现,没有哪支股票价格会一直下跌。在估值太高时,股价就会降低,相应的,估值如果太低,股价就会上涨。也就是股票价格总是围绕它的内在价值上下波动。

根据我们刚刚的发现,我们一起来剖析一下XX股票,XX股票的市盈率有多少呢?近十年,已经超过了8.15%,也就是xx股票目前的市盈率比近十年来低91.85%的时间,这个股票属于基金周期中的低估区间,可以有买入的考虑了。



买入股票,可别一次性的全部投入。而是可以分阶段来买,接下来我们会教大家一些方法。

我们用xx股票来说明,现在他的价格是79块多,你想用8万来投资股票,你可以买1000股,分四次买。

对近十年来的市盈率进行仔细的观察,意识到8.17就是近十年里市盈率的最低值,但是现在XX股票的市盈率是10.1。那么我们就平均的把8.17-10.1这个市盈率大区间切分成五个区间,每次买的时机就是降到一个区间的时候。

比方说,市盈率10.1买入1手,等到市盈率下降到9.5的时候再进行第二次的买入,买入2手,等到市盈率下降到8.9的时候再进行第三次的买入,买入3手,市盈率下跌至8.3买入4手。

要是购买之后就安心的把握股份,市盈率每降低一个区间,照计划买入。

一样的道理,假使这个股票的价格升高的话,可以将高的估值划分在一个地方,手里面所有的股票依次抛售。

Ⅳ 股票直线拟合是什么意思

就是针对某段行情,找到一条直线,使得这段行情在该线附近振荡。
如果严格说的话,假设一段行情从t0开始,到T结束,时间单位是dt,我们把股票行情记为f(t), t是时间。而直线就可以表示为line = a t, a是斜率,t是时间。
目的就是找到一个最好的a来拟合f(t):
即 min {SUM_t0^T (f(t)-at)^2}

Ⅵ 均线是越多越好吗

当趋势线的 R 平方值等于或近似于 1 时,趋势线最可靠。用趋势线拟合数据时,Excel 会自动计算其 R 平方值。许多股民朋友在炒股的可能更加看重的就是股价,然而就会不在乎一些重要的技术指标,那么炒股也是具有技术指标的,而均线这就是技术指标里的重要指标其中之一。均线究竟是什么,指的是什么以及怎么用呢?下面我就为大家简单说一下,希望对大家有用。学姐在讲之前,这里有份福利先领取--机构精选的牛股榜单新鲜出炉,赶紧看过来大福利,不要错过:【绝密】机构推荐的牛股名单泄露,限时速领!!!
一、均线的定义
1、均线是什么
均线简单的来说就是一种重要的技术指标,投资者经常用的,它是将某一段时间的收盘价之和除以该周期所得到的一根平均线。打比如一周内5天都是交易日,即是说5个交易日加起来除掉5便可得到平均数,同样,10日、20日等的均线也可用此法算出。
2、均线有哪些、不同颜色
均线参照的参数不一样,其作用和反应情况也不同。常用的参数有5日、10日、20日、30日、60日、120日、250日。常用的颜色有白色(5日线)、黄色(10日线)、紫色(20日线)、绿色(30日线)、灰色(60日线)、蓝色(120日线)、橙色(250日),颜色并不是一一对应的,股民可以看自己喜欢的颜色来设定。
二、均线的简单应用
1、如何在走势图看均线
(1)添加均线:首先要调整到股票软件界面再按一下MA键出现了下面这种图再按回车键就可以了

(2)查看均线:

2、分析时用哪条
均线反映的内容是一个时间区间内平均价格和趋势,均线可以将过去一个时段内价格总体运行情况直观地呈现给我们。每一根线的作用和意义都不同,接下来就给大家简略地说一下它们的关系吧
(1)5日均线(攻击线):攻击线向上,且股票价格上升突破攻击线则短期内看多。同样的状况下,假如说5日均线向下股价跌破均线则短期看空。
(2)10日均线(行情线):盘中的操盘线越来越高的时候,操盘线被股价突破的话,这就表明波段性中线上涨,否则,它会减少。
(3)20日均线(辅助线):起到的主要作用就是协助10日均线,对价格运行力度与趋势角度进行推动并修正,使得价格趋势运行的方向得以稳定。当在盘中辅助线呈持续向上的攻击状态的时候,如果价格突破辅助线,这就说明波段性中线行情已经开始看多,反向也就是空了。
(4)30日均线(生命线):作用就是指明股价在中期的各种运动趋势,生命线起到了一个较强的压力和支撑的作用。在盘中也是同样的,要是得到的生命线趋势是向上的,而股价突破或在线之上则看多,否则看空。
(5)60日均线(决策线):价格的中期反转趋势可以根据这个了解到,指导价格大波段级别运行于预定好的趋势之中。基本主力其实都会很重视这根均线的,它可以在股价中期的运动趋势起一个很大的作用。
(6)120日均线(趋势线):作用同样如此,也就是指明价格中长期的反转趋势,引导/指导价格大波段大级别在既定的趋势中运行。假如股价超过了趋势线,反转趋势在短期内应该不会有的,十天以上才会反转的。
(7)250日均线(年线):参考均线就可以判断是否可以长期投资。公司的大致情况和业绩它都有所呈现。
这些线主要有什么用都已经在上面提到过了,想要有更好的效果的话,就需要把多条均线结合起来进行分析。不知道哪只股票值得买入?会不会有风险的存在?戳这个链接就可以,即可获取专属于你的诊股报告!【免费】测一测你的股票当前估值位置?
3、均线一些常见形态有哪些?
(1)多头排列:表示多条均线使股价上涨,那么就是看多。

(2)空头排列:表示多条均线反压股价,则看空。

(3)银山谷:短中线的话都穿过长线时所形成的图像,下边有一个四边形,或者是三角,这里就和山谷相似,银山谷就是在长期下跌后首次出现的山谷。
(4)金山谷:在银山谷之后又出现一个山谷,时常会比银山谷的买入点更加真实。

通常大家买股票都是买的龙头股,因为这种类型的股票一直都是行业中的领先者,也可以在股市中带动一波好的行势。我这里也把A股各行业的龙头股名单理了出来,免费同大家一起分享~吐血整理!各大行业龙头股票一览表,建议收藏!

应答时间:2021-09-24,最新业务变化以文中链接内展示的数据为准,请点击查看

Ⅶ 如何计算股票的理论价值(真实价值)

股票价格是指股票的证券市场上买卖的价格。从理论上说,股票价格应由其价值决定,但股票本身并没有价值,不是在生产过程中发挥职能作用的现实资本,而只是一张资本凭证。股票之所以有价格,是因为它代表着收益的价值,即能给它的持有者带来股息红利。股票交易实际上是对未来收益权的转让买卖,股票价格就是对未来收益的评定。
股票及其他有价证券的理论价格是根据现值理论而来的。
由于未来收益及市场利率具有不确定性,各种价值模型计算出来的内在价值只是股票真实的内在价值的估计值。

(1)现代证券组合理论
在此基础上,马柯维茨于1952年发表了题为《证券组合的选择》的论文,他根据统计学上的均值、方差和协方差等指标,将单个股票和股票组合的收益和风险进行量化,将复杂的投资决策问题简化为收益-风险(期望值-方差)的二维问题,给出了投资者如何通过建立有效边界,并根据自身风险承受能力选择最优投资组合,以实现投资效用最大化的一整套理论,即现代证券组合理论(Modern Portfolio Theory,MPT)。

(2)资本资产定价模型
以夏普、林特纳和莫辛为代表的一批学者,在马柯维茨工作的基础上,开始把注意力从对单个投资者微观主体研究转到对整个市场的研究上,考虑若所有遵循马柯维茨定义下的投资者的共同行为将导致怎样的市场状态。在各自独立状态下,他们先后得出了有关资本市场均衡的相同结论,即着名的“资本资产定价模型”(Capital Asset Pricing Model,CAPM),从而开创了现代资产定价理论的先河。用E(Ri)表示股票(组合)i的预期收益率,E(Rm)表示市场组合的预期收益率,Rf表示无风险资产收益率,i表示股票(组合)收益率变动对市场组合的预期收益变动的敏感性,CAPM可以表达为:
E(Ri)=Rf+(i[E(Rm)-Rf]
CAPM的提出,一改以往证券理论的规范性研究方法,加上当时经济计量学的迅速发展和日趋丰富的数据资源,CAPM很快便引起经济学家们的广泛兴趣。但CAPM严格的假定条件却给经验验证造成了很大障碍,使得学者们不得不致力于对假定条件进行修改,以使其更符合实际。这项工作主要集中在70年代及其前后几年。其中代表人物有迈耶斯、默顿及埃尔顿等。然而,放松CAPM假设所产生的真正有价值的研究成果并不多,原因在于“当放松其中的一个条件时,仍可以得到一个与CAPM相似的定价模型,但同时放松两个条件时,就无法得出一个确定的均衡定价模型。”

(3)因素模型和套利定价理论
CAPM虽然绘出了理性投资者在均衡市场状态下的证券选择模式,但它没有进一步揭示影响均衡的内在因素是什么,这些因素是怎样影响证券价格或收益的。而因素模型正是在两种证券的价格或收益具有相关性的假设前提下,试图找出并分析对证券价格或收益影响较大的经济因素,并较准确地量化这些因素对证券价格或收益的敏感程度,使证券价格或收益有更合理的解释和更简便的估算方法。因素模型是由夏普于1963年最早提出,由于它往往以指数形式出现,所以又称为指数模型。以目前广为流行的夏普单因素模型为例,该模型认为各种证券收益的变动都决定于某一共同因素,该模型可表示为:
Yi = ai + biF + ei
其中:Yi表示证券i的收益率;ai表示其他因素为零时的收益率;bi表示证券对因素的灵敏度;F表示因素的数量指标;ei为随机误差项。
与此同时,一些学者选择了放弃CAPM假设,以新假设条件为出发点重新建立模型。其中最重要的成果当推罗斯的“套利定价理论”(Arbitrage Pricing Theory,APT)。该理论根据在完全竞争的市场中不存在套利机会的基本假设,直接将资产收益定义成一个满足以多因素(如工业总值、GNP等总体经济活动指标、通货膨胀率及利率等指标)作解释变量的线性模型。这样APT的工作就是从众多的可能影响因素中找出一组因素的线性组合来拟合定价模型。尽管APT看起来极其类似一种扩展的CAPM,但它是以一种极其不同的方式推导出来的。
APT模型实际上简化了假设条件,因而具有更现实的意义。所以,自其在70年代产生以来,便迅速得到人们普遍重视和广泛应用。

股票定价理论的新发展
MPT、CAPM及其拓展、因素模型和APT都是建立在线性分析范式、有效市场假说和均衡观点的基础上,尤其是线性模型的分析范式意味着资产收益率是呈现正态分布或近似正态分布,并且投资者以线性的方式对市场信息做出反映。然而现实中资本市场上越来越多的迹象表明,股票价格并不完全按照上述经典理论所描述的那样表现。尤其是经历“黑色星期一”之后,一些金融经济学家开始怀疑股票市场运动机制本身的不稳定性,认识到传统的线性模型很难准确预测股价变动,可能还有许多未知因素影响着股价的运动,于是采用了整体化的混沌分析思想来理解股市的非均衡状态,他们摒弃了风险与收益呈线性关系的假设,采用非线性的动态定价模型,如EGARCH、AGARCH等,甚至尝试放弃风险与收益存在正相关关系的基本假设前提,提出了具有黑盒子性质的“定价核”(PriceKernel)概念。此外,在传统的CAPM、APT等所依赖的主观分析、因子分析等因素提取技术方法缺乏有效解释力的情况下,一些学者提出了半自回归方法和半非参数估计方法等新手段。

Ⅷ 如何用Arma模型做股票估计

时间序列分析是经济领域应用研究最广泛的工具之一,它用恰当的模型描述历史数据随时间变化的规律,并分析预测变量值。ARMA模型是一种最常见的重要时间序列模型,被广泛应用到经济领域预测中。给出ARMA模型的模式和实现方法,然后结合具体股票数据揭示股票变换的规律性,并运用ARMA模型对股票价格进行预测。
选取长江证券股票具体数据进行实证分析
1.数据选取。
由于时间序列模型往往需要大样本,所以这里我选取长江证券从09/03/20到09/06/19日开盘价,前后约三个月,共计60个样本,基本满足ARMA建模要求。
数据来源:大智慧股票分析软件导出的数据(股价趋势图如下)
从上图可看出有一定的趋势走向,应为非平稳过程,对其取对数lnS,再观察其平稳性。
2.数据平稳性分析。
先用EVIEWS生成新序列lnS并用ADF检验其平稳性。
(1)ADF平稳性检验,首先直接对数据平稳检验,没通过检验,即不平稳。
可以看出lnS没有通过检验,也是一个非平稳过程,那么我们想到要对其进行差分。
(2)一阶差分后平稳性检验,ADF检验结果如下,通过1%的显着检验,即数据一阶差分后平稳。
可以看出差分后,明显看出ADF Test Statistic 为-5.978381绝对值是大于1%的显着水平下的临界值的,所以可以通过平稳性检验。
3.确定适用模型,并定阶。可以先生成原始数据的一阶差分数据dls,并观测其相关系数AC和偏自相关系数PAC,以确定其是为AR,MA或者是ARMA模型。
(1)先观测一阶差分数据dls的AC和PAC图。经检验可以看出AC和PAC皆没有明显的截尾性,尝试用ARMA模型,具体的滞后项p,q值还需用AIC和SC具体确定。
(2)尝试不同模型,根据AIC和SC最小化的原理确定模型ARMA(p,q)。经多轮比较不同ARMA(p,q)模型,可以得出相对应AIC 和 SC的值。
经过多次比较最终发现ARMA(1,1)过程的AIC和SC都是最小的。最终选取ARIMA(1,1,1)模型作为预测模型。并得出此模型的具体表达式为:
DLS t = 0.9968020031 DLS (t-1)- 1.164830718 U (t-1) + U t
4.ARMA模型的检验。选取ARIMA(1,1,1)模型,定阶和做参数估计后,还应对其残差序列进行检验,对其残差的AC和Q统计检验发现其残差自相关基本在0附近,且Q值基本通过检验,残差不明显存在相关,即可认为残差中没有包含太多信息,模型拟合基本符合。
5.股价预测。利用以上得出的模型,然后对长江证券6月22日、23日、24日股价预测得出预测值并与实际值比较如下。
有一定的误差,但相比前期的涨跌趋势基本吻合,这里出现第一个误差超出预想的是因为6月22日正好是礼拜一,波动较大,这里正验证了有研究文章用GARCH方法得出的礼拜一波动大的结果。除了礼拜一的误差大点,其他日期的误差皆在接受范围内。
综上所述,ARMA模型较好的解决了非平稳时间序列的建模问题,可以在时间序列的预测方面有很好的表现。借助EViews软件,可以很方便地将ARMA模型应用于金融等时间序列问题的研究和预测方面,为决策者提供决策指导和帮助。当然,由于金融时间序列的复杂性,很好的模拟还需要更进一步的研究和探讨。在后期,将继续在这方面做出自己的摸索。

Ⅸ 什么是拟合指数

拟合指数 Simulation Index/fit index/Agreement Index
拟合是《计量经济学》研究的范畴,所谓拟合指数简单的说就是选择的变量与被解释变量之间的相关关系
股票\基金拟合指数:

指数基金是一种拟合目标指数、跟踪目标指数变化为原则,实现与市场同步成长的基金品种。指数基金的投资采取拟合目标指数收益率的投资策略,分散投资于目标指数的成分股,力求股票组合的收益率拟合该目标指数所代表的资本市场平均收益率。

操作简单透明度高

从理论上讲,指数基金的运作方法简单,只要根据每一种证券在指数中所占的比例购买相应比例的证券,长期持有就可。

其次,指数基金费用低廉。由于指数基金采取持有策略,不用经常换股,交易成本远远低于积极管理的基金。

此外,指数基金的业绩透明度较高。投资人看到指数型基金跟踪的目标基准指数涨了,就会知道自己投资的指数型基金今天净值大约能升多少。所以很多机构投资人和一些看得清大势、看不准个股的个人投资者比较喜欢投资指数型基金,不必再有“赚了指数不赚钱”的苦恼。

有效规避非系统性风险

与其他基金相比,指数基金的优点首先在于能够有效规避非系统性风险,因而指数基金广泛地分散投资,任何单个股票的波动都不会对指数基金的整体表现构成影响,从而分散风险。另一个方面,由于指数基金所钉住的指数一般都具有较长的历史可以追踪,在一定程度上指数基金的风险是可以预测的。

因此,从长期来看,指数基金投资业绩优于其他基金。2006年,市场上的指数基金以平均125.87%的年累计净值增长率成为最赚钱的基金品种。这种基金不会对某些特定的证券或行业投入过量资金。它一般会保持全额投资而不进行市场投机。

关键因素拟合指数化投资方法的实证研究

指数化投资是一种试图完全复制某一证券价格指数或者按照证券价格指数编制原理构建投资组合而进行的证券投资。按此种方式投资的基金称为指数基金,其收益水平目标是所基指数的变化幅度。自20世纪90年代以来,美国华尔街上大多数股票基金管理人的业绩都低于同期市场指数的表现,这样,以复制市场指数走势为核心思想的指数基金在全球范围内迅速发展壮大起来,并对传统的证券投资思维形成巨大的冲击与挑战。在美国,指数基金的收益超过65~80%的共同基金,因而越来越受到欢迎。流入共同基金市场的新增资金中,流入指数基金的比例由1994年的2%增加到1999年的31%。1999年末美国指数基金总资金量达到3380亿美元,占全美股票基金总量的8.37%。最大的指数基金、也是全美最大的共同基金Vanguard S&P 500管理着1050亿美元的资金。
我国的指数化投资出现较晚,这主要是因为我国的证券市场还比较年轻,还在不断探索和发展,我国的投资者群体还不成熟,缺乏科学的投资观念,市场行为的监管还欠完善,庄家炒作等非市场行为对股指有较大影响。由于这些原因的共同影响,我国股票指数常常与市场背离,不能反映市场的真实情况。
就指数化投资方法而言,市场上常用的方法主要是完全复制某一证券价格指数或者按照证券价格指数编制原理构建投资组合。这种传统的指数化投资方法相对比较被动,在大盘正常运行的时候可以良好运作,但是当部分样本股出现异常的快速上扬或急速下跌时,将失去进一步盈利和及时止损的机会。为了弥补这一不足,各种替代方法应运而生。
Francesco Corielli与Massimiliano Marcellino(2002)认为跟踪指数是要建立指数的替代投资组合(replica),这个替代投资组合包含的股票要远远少于指数所包含的股票,并且跟踪误差中不包含非经常性成份,他们运用动态因子提取方法建立指数替代投资组合,用蒙特.卡罗经验指数和EURO STOXX50指数进行了验证。验证结果令人鼓舞,替代投资组合基本完成了跟踪曲线[7]。吴冲锋(2000)运用未定因素含义法分析1998年7月8日至1999年3月29日期间上证30指数样本股,得出由6只股票的投资组合替代上证30指数的结论[6]。
从以上研究我们发现,指数化投资方法不一定非要按照证券价格指数编制原理构建投资组合,可以通过构建替代投资组合对指数进行跟踪。在此基础上,笔者提出关键因素拟合指数化投资方法,该方法认为,股票指数由其样本股按照证券价格指数编制原理构成,它的走势体现了这些样本股的共同作用,但并不是每一只样本股对指数的贡献都一样,股票指数中存在关键性因素,这些关键因素对股指的影响体现在各自所代表的样本股的表现之上。同样,也并不是每一种关键因素所代表的样本股对它的贡献都一样,关键因素中存在最具代表性的关键样本股,正是这些最具代表性的关键样本股对股票指数起着举足轻重的作用,我们只要抓住了它们就抓住了股票指数,换句话说,我们只要投资于这些关键因素拟合的组合就等于投资了这个股票指数了。另外,同一关键因素中具有代表性的关键样本股之间具有可替代性,可以使对股票指数的投资更加灵活,又不会影响投资组合的指数化性质,在一定程度上弥补了传统方法的不足。
下面我们将以上证50指数为研究对象,对关键因素指数化投资方法进行实证研究。论文的结构安排如下:首先,我们进行研究设计,确定研究的程序、模型、样本及数据;然后,我们对数据进行因子分析,提取出上证50指数的关键因素;在此基础上,我们将按关键因素构造出的投资组合与实际的上证50指数进行相关性检验和回归分析以验证该方法;最后得出结论。
研究设计

一、 研究程序与模型设计
第一步,我们要找出影响上证50指数走势的关键性因素。
我们以上证50指数成份股个股的日收益率为基础进行因子分析,提取出反映上证50指数走势的n个共同因子,这n个共同因子即代表了影响上证50指数走势的n个关键因素的。构造多因素模型如下:
Index50=A1*F1+A2*F2+……+An*Fn+ε
式中:Index50为上证50指数;Fn为第n个共同因子;An为第n个共同因子对上证50指数的贡献率;ε为残差。
在找出这n个关键因素之后,我们要进一步找出这n种关键性的共同因子所代表的样本股。对应关系如下:
F1~a1(stock11)+a2(stock12)+……
F2~b1(stock21)+b2(stock22)+……
…………………………………
Fn~n1(stockn1)+n2(stockn2)+……
式中:Fn为第n个共同因子;stock为共同因子所代表的样本股;a、b……n为样本股对共同因子的贡献率,即因子负荷。
观察共同因子的因子负荷强弱,我们可以分析判断出各个共同因子所反映的关键因素,并对它们进行相应的解释。
第二步,为了证明我们找出的这n个关键因素是否真的能够反映上证50指数的走势。我们用它们中最具代表性的一组样本股构造出一个投资组合Portfolio50,与上证50指数Index50进行比较,验证是否Portfolio50与Index50等价。
为此,我们找出对这n个关键因素最有代表性的i个样本股,按照其方差对总方差解释的贡献率所占比重作为权重构造投资组合如下:
Portfolio50=w1*STOCK1+w2*STOCK2+……+wi*STOCKi
式中:Portfolio50为构造的投资组合的日收益率;STOCKi为参与构造投资组合的第i个最有代表性的样本股的日收益率;wi为第i只样本股的权重。
计算出投资组合Portfolio50的日收益率和上证50指数的日收益率Index50,在通过相关性检验之后,将Portfolio50与Index50进行线性回归分析。构造回归模型如下:
Portfolio50=a+b*(Index50)+ε
式中:Portfolio50为构造的投资组合的日收益率;Index50为上证50指数的日收益率;a为常数项;b为回归系数;ε为残差。
如果该模型经检验成立,并且a趋近于0,同时b趋近于1,那么Portfolio50≈Index50,即Portfolio50与Index50等价,说明我们找出的这n各关键性因素能够真实地反映上证50指数的走势,Portfolio50可以代替上证50指数进行指数化投资。
二、 模型变量计算
上证50指数成份股个股日收益率用相对收益率计算,假如碰到配股、送股、送现金红利的情况,则用下面的公式计算:

式中:rit为第i种股票的第t日收益率;Pt、Pt-1分别为t日和t-1日的收盘价;C为以t-1日为基准的t日每股现金红利;As为以t-1日为基准的t日每股配股比例;S为以t-1日为基准的t日每股配股价;Ad为以t-1日为基准的t日每股送股比例。
上证50指数日收益率Index50同样用相对收益率计算,公式如下:

式中:Rt为上证50指数的第t日收益率;Pt、Pt-1分别为上证50指数t日和t-1日的收盘价。
三、 研究样本选择
本文研究中所需的上证50指数收盘价、成份股个股的收盘价、现金红利等原始交易数据来源于上海万国股市测评咨询有限公司制作的“大智慧证券信息平台V5.00”。
因子分析过程中,样本数据时期为2002年12月03日至2004年03月18日,每只样本股包含309条数据记录。由于各种原因引起暂时停牌而产生的缺失值采用相邻数据平均法填补。
考虑到个别新上市公司样本股上市日期太短,样本数据数量不充分,业绩容易出现非正常波动,而且公司内部各方面的运行机制还不够健全和完善,为使检验不受少部分数据干扰,将其剔出样本股,在关键因素确立之后再根据专业知识单独判断其属性。剔出样本股共五只,分别为:白云机场(600004)、华夏银行(600015)、南方航空(600029)、中信证券(600030)和长江电力(600900)。
综上,因子分析样本股中共纳入45只上证50指数样本股,每只含309条日收益率记录,共计309组,13905条日收益率记录。
相关性检验与回归分析过程中,由于上证50指数自2004年1月2日起正式发布,指数简称上证50,指数代码000016,基日为2003年12月31日。到目前为止数据量太小,所以我们无法直接用它计算。但是上海证券交易所为上证50的顺利推出,于2003年1月2日起发布上证50板块概念指数993265。其编制方法与走势和上证50基本相同,只是所取的基数有所不同。在此我们用上证50板块概念指数993265数据代替上证50指数000016数据进行计算。计算的时间跨度为前面分析时期的子集区间2003年07月22日至2004年03月12日,同样,缺失值的处理方法采用相邻数据平均数填补法,共计155组数据。

因子分析

表1 KMO统计量和Bartlett’s球形检验表
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .958
Bartlett's Test of Sphericity Approx. Chi-Square 9857.426
df 990
Sig. .000
首先,我们对各样本股日收益率数据采用KMO统计量和Bartlett’s球形检验,以判断样本数据是否符合因子分析的前提条件。可以看出,表格中检验变量间偏相关性的KMO统计量,数值为0.958,接近1,表明各变量间的相关程度无太大差异,数据非常适合做因子分析。同时,Bartlett’s球形假设检验的结果也被拒绝,强烈认可了变量之间的相关性,说明各样本股日收益率之间存在共同信息,符合提取共同因子的前提条件。见表1。
本文采用的因子提取方法为主成分分析法(Principal Components Analysis)。考虑到共同因子的可解释性,在提取因子的过程中采用正交旋转,具体旋转方法为方差最大化正交旋转(Varimax)。根据提取的主成分共同因子的累积贡献率达到约85%以上为标准,一共提取20个共同因子。信息提取的充分性检验表(略)告诉我们,按照上诉共同因子提取标准,样本股信息的提取基本是充分的。
表2 共同因子所解释的方差百分比表
Factor F1 F2 F3 F4 F5 F6 F7 F8 F9 F10
%of Variance 42.311 6.849 4.540 3.208 2.395 2.856 2.367 2.133 2.035 1.844
Cumulative% 42.311 49.160 53.700 56.908 59.764 62.158 64.525 66.658 68.693 70.537
Factor F11 F12 F13 F14 F15 F16 F17 F18 F19 F20
%of Variance 1.728 1.674 1.553 1.491 1.410 1.324 1.286 1.261 1.201 1.154
Cumulative% 72.265 73.939 75.491 76.982 78.392 79.716 81.002 82.263 83.464 84.618
我们把共同因子所解释的方差百分比(表2)作为因子对指数所贡献的权重,相应的多因素模型如下:
Index50=0.4231*F1+0.0685*F2+0.0454*F3+0.0321*F4+0.0286*F5+0.0239*F6+0.0237*F7+0.0213*F8+0.0204*F9+0.0184*F10+0.0173*F11+0.0167*F12+0.0155*F13+0.0149*F14+0.0141*F15+0.0132*F16+0.0129*F17+0.0126*F18+0.0120*F19+0.0115*F20+ε
经过方差最大化正交旋转之后,将因子和变量之间因子负荷大于0.4的变量提出来,再根据同一样本股对共同因子的贡献大小取相对较大的值。我们得到以下20个共同因子所主要代表的样本股列表,见表3。

表4 共同因子代表样本股列表
F1 600028 中国石化 F5 600664 哈药集团
600808 马钢股份 600038 哈飞股份
600688 上海石化 F6 600839 四川长虹
600019 宝钢股份 600033 福建高速
600026 中海发展 600008 首创股份
600569 安阳钢铁 F7 600591 上海航空
600050 中国联通 600221 海南航空
600036 招商银行 F8 600795 国电电力
600350 山东基建 600011 华能国际
600649 原水股份 600642 申能股份
600000 浦发银行 F9 600643 爱建股份
F2 600602 广电电子 F10 600887 伊利股份
600832 东方明珠 600597 光明乳业
600637 广电信息 F11 600016 民生银行
600100 清华同方 F12 600811 东方集团
600171 上海贝岭 F13 600652 爱使股份
600601 方正科技 F14 600006 东风汽车
F3 600609 金杯汽车 F15 600812 华北制药
600805 悦达投资 F16 600705 北亚集团
600104 上海汽车 F17 600895 张江高科
F4 600717 天津港 F18 600863 内蒙华电
600018 上港集箱 F19 600098 广州控股
600009 上海机场 F20 - -
各个共同因子与样本股的因子负荷对应关系如下:
F1~0.84(600028)+0.84(600808)+0.83(600688)+0.82(600019)+0.65(600026)+0.61(600569)+0.61(600050)+0.55(600036)+0.53(600350)+0.46(600649)+0.45(600000)
F2~0.88(600602)+0.86(600832)+0.85(600637)+0.78(600100)+0.69(600171)+0.49(600601)
F3~0.81(600609)+0.75(600805)+0.63(600104)
F4~0.76(600717)+0.67(600018)+0.46(600009)
F5~0.88(600664)+0.85(600038)
F6~0.66(600839)+0.49(600033)+0.46(600008)
F7~0.72(600591)+0.67(600221)
F8~0.56(600795)+0.55(600011)+0.52(600642)
F9~0.83(600643)
F10~0.75(600887)+0.40(600597)
F11~0.80(600016)
F12~0.81(600811)
F13~0.81(600652)
F14~0.97(600006)
F15~0.80(600812)
F16~0.77(600705)
F17~0.78(600895)
F18~0.75(600863)
F19~0.52(600098)
F20~----------------
观察共同因子代表样本股列表与因子负荷对应关系,我们可以分析判断出各个共同因子所反映的关键因素如下:
F1对应的样本股分别为:600028中国石化、600808马钢股份、600688上海石化、600019宝钢股份、600026中海发展、600569安阳钢铁、600050中国联通、600036招商银行、600350山东基建、600649原水股份、600000浦发银行,这些都是广大股民所熟知的经营业绩优秀,净资产收益率很高的大盘蓝筹股,其中也包含了几只银行股,可以说是大盘中的大盘,蓝筹中的蓝筹,我们可以定义因子F1为“大盘深蓝股”。
F2对应的样本股分别为:600602广电电子、600832东方明珠、600637广电信息、600100清华同方、600171上海贝岭、600601方正科技,这几只股票是高科技行业的杰出代表,主营计算机、微电子和信息产业,具有高成长性,我们可以定义因子F2为“高科技成长股”。
F3对应的样本股分别为:600609金杯汽车、600805悦达投资、600104上海汽车,属于典型的汽车类股票,随着近几年汽车行业的崛起,业绩呈现稳步增长,我们可以定义因子F3为“汽车蓝筹股”。
F4对应的样本股分别为:600717天津港、600018上港集箱、600009上海机场,与水陆空港口物流和运输有密切关系,我们可以定义因子F4为“港口物流股”。
F5对应的样本股分别为:600664哈药集团、600038哈飞股份,具有明显的地域色彩,触摸到东北老工业基地的发展脉搏,我们可以定义因子F5为“东北老工业股”。
F6对应的样本股分别为:600839四川长虹、600033福建高速、600008首创股份,其中600033福建高速、600008首创股份主要是经营公益事业和基础设施,我们可以定义因子F6为“基础公益股”。但600839四川长虹的主营是电视机、空调等家用电器产品,业绩彪炳,被归于此类可以算是因统计之外原因引起的一个例外。
F7对应的样本股分别为:600591上海航空、600221海南航空,国内航空运输业的两只优质股票,我们可以定义因子F7为“航空运输股”。
F8对应的样本股分别为:600795国电电力、600011华能国际、600642申能股份,显然代表电力能源,我们可以定义因子F8为“电力能源股”。
F9对应的样本股为:600643爱建股份,是上证50成份股中的非银行类金融股,我们可以定义因子F9为“非银行金融股”。
F10对应的样本股分别为:600887伊利股份、600597光明乳业,皆为乳品业龙头,乳业产品的消费与老百姓日常生活息息相关,其业绩从一定角度上也体现了老百姓生活的富裕程度,我们可以定义因子F10为“乳品消费股”。
F11对应的样本股为:600016民生银行,银行类股票。F12对应的样本股为:600811东方集团,一只综合类股票,涉猎金融、电子商务、建材、通讯等领域。F13对应的样本股为:600652爱使股份,主营计算机硬件及网络设备。F14对应的样本股为:600006东风汽车,汽车行业股票。F15对应的样本股为:600812华北制药,医药化工产品的生产和销售。F16对应的样本股为:600705北亚集团,主营运输物流及贸易。F17对应的样本股为:600895张江高科,房地产类个股。F18对应的样本股为:600863内蒙华电,主营活力发电、供热。F19对应的样本股为:600098广州控股,从事能源、物流、基础设施等综合类股票。这些因子所代表的个股具有很强的针对性,虽然有些个股可以归结为前面几种共同因子,但从统计学角度来说,应单独列出,以保证对原始信息的完整反映。F20对应的样本股因子负荷均小于0.4,说明其可解释性很小,体现的样本股散乱,从专业的角度看没有分析价值,故此将它剔出。
对于白云机场(600004)、华夏银行 (600015)、南方航空(600029)、中信证券(600030)和长江电力(600900)这五只由于上市时间不长而被剔出的个股,我们可以运用专业知识将其归类,并在今后的分析中予以验证。白云机场(600004)主营空港物流,可归为F4;华夏银行(600015)属于银行股,可归为F11;南方航空(600029)主营航空运输业,可归为F7;中信证券(600030)为非银行金融股,可归为F9和长江电力(600900)主营电力能源,可归为F8。
综上所述,通过对上证50指数成份股个股的日收益率数据因子分析,我们提取出有实际意义的F1~F19这19个共同因子,代表了影响上证50指数走势的19个关键因素。构造多因素模型如下:
Index50=0.4231*F1+0.0685*F2+0.0454*F3+0.0321*F4+0.0286*F5+0.0239*F6+0.0237*F7+0.0213*F8+0.0204*F9+0.0184*F10+0.0173*F11+0.0167*F12+0.0155*F13+0.0149*F14+0.0141*F15+0.0132*F16+0.0129*F17+0.0126*F18+0.0120*F19 +ε

相关性检验与回归分析
我们将因子分析中提取的19种共同因子中有代表性的样本股加权组合构造出一个投资组合Portfolio50,每个样本股的权重就等于每种共同因子所解释的方差百分比在累积百分比之中所占的比重。比如:共同因子F1的权重等于(42.311/83.464=0.5069)。考虑到F1因子所代表的股票较多,且权重比例较大,故选入排名前四位的4只股票,每只股票权重取F1因子权重的四分之一,共计22只样本股。
构造投资组合如下:
Portfolio50=0.1267*((600028)+(600808)+(600688)+(600019))+0.0821*(600602)+0.0544*(600609)+0.0384*(600717)+0.0342*(600664)+0.0287*(600839)+0.0284*(600591)+0.0256*(600795)+0.0244*(600643)+0.0221*(600887)+0.0207*(600016)+0.0201*(600811)+0.0186*(600652)+0.0179*(600006)+0.0169*(600812)+0.0159*(600705)+0.0154*(600895)+0.0151*(600863)
Portfolio50与Index50相关性检验表(略)显示,Portfolio50与Index50的相关系数在0.01置信水平下为0.943,说明Portfolio50与Index50高度相关。
表4 回归模型与检验结果表
Model Sum of Squares df Mean Square F Sig.
1 Regression .025 1 .025 1238.863 .000
Resial .003 153 .000
Total .028 154

表5 回归系数与检验结果表
Model Unstandardized Coefficients Standardized Coefficients t Sig. Correlations
B Std. Error Beta Zero-order Partial Part
1 (Constant) 7.235E-04 .000 2.004 .047
INDEX50 1.021 .029 .943 35.197 .000 .943 .943 .943
从回归模型与检验结果(表4)我们可以看出该回归模型具有明显的统计学意义。从回归系数与检验结果(表5)我们可以看出该回归模型系数b具有明显的统计学意义,且b值为1.021。对于常数项的检验虽然没有统计学意义,但这无关紧要,出于常识,我们一般都将其保留在方程中,a值为0.0007235。
据此我们可以构建回归模型如下:
Portfolio50=0.0007235+1.021*(Index50)
式中:常数项a=0.0007235,非常接近于0,回归系数b=1.021,也同样接近于1。所以我们可以认为Portfolio50≈Index50。
最后,我们进行回归模型拟合效力评价分析(过程略)。由拟合模型的拟合优度简报和Durbin-Watson统计量我们可以得出确定系数R2为0.89,校正的确定系数Adjusted R2为0.889,说明该模型拟合效果显着。Durbin-Watson统计量为1.786,取值在2附近。可见残差间没有明显的相关性。为了进一步分析模型的正态性,即的残差ε是否服从正态分布,我们做出残差分布直方图和正态PP图(见图1、图2)。可见,该模型残差基本服从正态分布。

图1 残差分布直方图 图2 残差的正态PP图

结论

根据以上实证研究,我们得出如下结论:
1.在2002年12月3日至2004年3月18日期间,上证50指数的50种样本股的收益率受到19种关键因素的影响。这19种关键因素中最有代表性的是600028中国石化、600602广电电子等22只样本股。从另外一个角度看,这22只样本股的总体走势基本上反映了上证50指数的50只样本股的走势。
2.影响上证50指数的关键因素具有很强的板块效应,企业性质、经营主业、地域特征和管理业绩相同或相近的股票走势高度相关,可归为同一关键因素。但同时个股的表现也同样突出,几乎每个板块中都有个别股票表现与众不同,这些特立独行的个股由于经营、资本运作等众多原因,走出了自己的特色,成为了市场不可或缺的亮点,对指数有着重要的贡献。
3.从个股对上证50指数关键因素的影响来看,如果一个关键因素所代表的样本股的个数少,则说明这些样本股更加具有代表性。相反,如果一个关键因素所代表的样本股的个数多,则说明这些样本股之间具有可替代性,也就是说,如果需要调整投资组合,就可以在代表多数样本股的因子中进行调整,这样不会影响投资组合的代表性。
4.如果要对上证50指数进行指数化投资,不需要投资于所有的50种样本股,只需要投资于19种关键因素中最有代表性的22只关键样本股即可,构造投资组合如下:Portfolio50=0.1267*((600028)+(600808)+(600688)+(600019))+0.0821*(600602)+0.0544*(600609)+0.0384*(600717)+0.0342*(600664)+0.0287*(600839)+0.0284*(600591)+0.0256*(600795)+0.0244*(600643)+0.0221*(600887)+0.0207*(600016)+0.0201*(600811)+0.0186*(600652)+0.0179*(600006)+0.0169*(600812)+0.0159*(600705)+0.0154*(600895)+0.0151*(600863)。检验结果表明,这22种具有代表性的关键样本股构造的投资组合Portfolio50的收益率基本上反映了上证50指数Index50的收益率,并且两者的风险处在同一水平上,即可以用投资组合Portfolio50来替代上证50指数进行指数化投资。另外,由于同一关键因素所代表的股票具有可替代性,使得投资组合Portfolio50的构造更加灵活,我们可以根据市场的具体情况对该投资组合Portfolio50进行调整,同时还不会影响它对指数的反映。
以上结论说明,我们从实证研究的角度验证了关键因素拟合指数化投资方法,即指数化投资不必完全复制股票指数,股票指数中存在关键因素,利用这些关键因素构造的投资组合可以拟合出相应的股票指数,用来进行指数化投资。这种方法能够适用于多种指数,并且操作灵活积极,基金经理可以同时结合其他的分析工具,根据市场的具体情况对拟合的投资组合进行调整,从而达到最佳的投资绩效。

Ⅹ eviews中运用某个股票的价格拟合ARIMA模型,如何处理其中的缺失值

eviews拟合ARIMA模型问题均可+名中我QQ来给以解决。