当前位置:首页 » 股票盈亏 » 股票价格时间序列是否平稳
扩展阅读
设计总院股票历史股价 2023-08-31 22:08:17
股票开通otc有风险吗 2023-08-31 22:03:12
短线买股票一天最好时间 2023-08-31 22:02:59

股票价格时间序列是否平稳

发布时间: 2022-12-10 17:22:40

❶ 非平稳时间序列可以预测股票走势吗

一般把非平稳时间序列转化为平稳时间序列的方法是取n阶差分法。

比如举个例子,假设xt本身是不平稳的时间序列,如果xt~I(1) ,也就是说x的1阶差分是平稳序列。
那么 xt的1阶差分dxt=x(t)-x(t-1) 就是平稳的序列 这时dt=x(t-1)

如果xt~I(2),就是说xt的2阶差分是平稳序列的话
xt的1n阶差分dxt=x(t)-x(t-1) 这时xt的1阶差分依然不平稳,
那么 对xt的1阶差分再次差分后,
xt的2阶差分ddxt=dxt-dxt(t-1)便是平稳序列 这时dt=-x(t-1)-dxt(t-1)

n阶的话可以依次类推一下。

❷ arima模型python 怎么看平稳性

时间序列分析(一) 如何判断序列是否平稳
序列平稳不平稳,一般采用两种方法:
第一种:看图法
图是指时序图,例如(eviews画滴):

分析:什么样的图不平稳,先说下什么是平稳,平稳就是围绕着一个常数上下波动。
看看上面这个图,很明显的增长趋势,不平稳。

第二种:自相关系数和偏相关系数
还以上面的序列为例:用eviews得到自相关和偏相关图,Q统计量和伴随概率。

分析:判断平稳与否的话,用自相关图和偏相关图就可以了。
平稳的序列的自相关图和偏相关图不是拖尾就是截尾。截尾就是在某阶之后,系数都为 0 ,怎么理解呢,看上面偏相关的图,当阶数为 1 的时候,系数值还是很大, 0.914. 二阶长的时候突然就变成了 0.050. 后面的值都很小,认为是趋于 0 ,这种状况就是截尾。再就是拖尾,拖尾就是有一个衰减的趋势,但是不都为 0 。
自相关图既不是拖尾也不是截尾。以上的图的自相关是一个三角对称的形式,这种趋势是单调趋势的典型图形。

下面是通过自相关的其他功能
如果自相关是拖尾,偏相关截尾,则用 AR 算法
如果自相关截尾,偏相关拖尾,则用 MA 算法
如果自相关和偏相关都是拖尾,则用 ARMA 算法, ARIMA 是 ARMA 算法的扩展版,用法类似 。
不平稳,怎么办?
答案是差分
还是上面那个序列,两种方法都证明他是不靠谱的,不平稳的。确定不平稳后,依次进行1阶、2阶、3阶...差分,直到平稳位置。先来个一阶差分,上图。

从图上看,一阶差分的效果不错,看着是平稳的。

❸ 如何深入理解时间序列分析中的平稳性

声明:本文中所有引用部分,如非特别说明,皆引自Time Series Analysis with Applications in R.

接触时间序列分析才半年,尽力回答。如果回答有误,欢迎指出。

对第一个问题,我们把它拆分成以下两个问题:

Why stationary?(为何要平稳?)
Why weak stationary?(为何弱平稳?)

Why stationary?(为何要平稳?)
每一个统计学问题,我们都需要对其先做一些基本假设。如在一元线性回归中(),我们要假设:①不相关且非随机(是固定值或当做已知)②独立同分布服从正态分布(均值为0,方差恒定)。

在时间序列分析中,我们考虑了很多合理且可以简化问题的假设。而其中最重要的假设就是平稳。
The basic idea of stationarity is that the probability laws that govern the behavior of the process do not change over time.
平稳的基本思想是:时间序列的行为并不随时间改变。
正因此,我们定义了两种平稳:
Strict stationarity: A time series {} is said to be strictly stationary if the joint distribution of ,, · · ·, is the same as that of,, · · · ,for all choices of natural number n, all choices of time points ,, · · · , and all choices of time lag k.
强平稳过程:对于所有可能的n,所有可能的,, · · · , 和所有可能的k,当,, · · ·,的联合分布与,, · · · ,相同时,我们称其强平稳。
Weak stationarity: A time series {} is said to be weakly (second-order, or co-variance) stationary if:
① the mean function is constant over time, and
② γ(t, t − k) = γ(0, k) for all times t and lags k.
弱平稳过程:当①均值函数是常数函数且②协方差函数仅与时间差相关,我们才称其为弱平稳。
此时我们转到第二个问题:Why weak stationary?(为何弱平稳?)
我们先来说说两种平稳的差别:

两种平稳过程并没有包含关系,即弱平稳不一定是强平稳,强平稳也不一定是弱平稳。
一方面,虽然看上去强平稳的要求好像比弱平稳强,但强平稳并不一定是弱平稳,因为其矩不一定存在。
例子:{}独立服从柯西分布。{}是强平稳,但由于柯西分布期望与方差不存在,所以不是弱平稳。(之所以不存在是因为其并非绝对可积。)
另一方面,弱平稳也不一定是强平稳,因为二阶矩性质并不能确定分布的性质。
例子:,,互相独立。这是弱平稳却不是强平稳。

知道了这些造成差别的根本原因后,我们也可以写出两者的一些联系:

一阶矩和二阶矩存在时,强平稳过程是弱平稳过程。(条件可简化为二阶矩存在,因为)
当联合分布服从多元正态分布时,两平稳过程等价。(多元正态分布的二阶矩可确定分布性质)

而为什么用弱平稳而非强平稳,主要原因是:强平稳条件太强,无论是从理论上还是实际上。
理论上,证明一个时间序列是强平稳的一般很难。正如定义所说,我们要比较,对于所有可能的n,所有可能的,, · · · , 和所有可能的k,当,, · · ·,的联合分布与,, · · · ,相同。当分布很复杂的时候,不仅很难比较所有可能性,也可能很难写出其联合分布函数。
实际上,对于数据,我们也只能估算出它们均值和二阶矩,我们没法知道它们的分布。所以我们在以后的模型构建和预测上都是在用ACF,这些性质都和弱项和性质有关。而且,教我时间序列教授说过:"General linear process(weak stationarity, linearity, causality) covers about 10% of the real data." ,如果考虑的是强平稳,我觉得可能连5%都没有了。

对第二个问题:
教授有天在审本科毕业论文,看到一个写金融的,用平稳时间序列去估计股票走势(真不知这老兄怎么想的)。当时教授就说:“金融领域很多东西之所以难以估计,就是因为其经常突变,根本就不是平稳的。”
果不其然,论文最后实践阶段,对于股票选择的正确率在40%。连期望50%都不到(任意一点以后要么涨要么跌)。

暑假里自己用了一些时间序列的方法企图开发程序性交易程序。
刚开始收益率还好,越往后就越...后面直接亏损了...(软件是金字塔,第二列是利润率)

亏损的图当时没截,现在也没法补了,程序都删了。
所以应该和平稳没关系吧,毕竟我的做法也没假设是平稳的。如果平稳我就不会之后不盈利了。
(吐槽)自己果然不适合做股票、期货什么的...太高端理解不能...

❹ 19正态性和平稳性检验

** 正态分布与正态性检验**
正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution)。正态分布是具有两个参数 μ 和 σ^2 的连续型随机变量的分布,第一参数 μ 是服从正态分布的随机变量的均值,第二个参数 σ^2 是此随机变量的方差。

正态性检验(Normality Test)是一种特殊的假设检验,是检验一批观测值(或对观测值进行函数变换后的数据)或一批随机数是否来自正态总体,是否服从正态分布。这是当基于正态性假定进行统计分析时,如果怀疑总体分布的正态性,应进行正态性检验。但当有充分理论依据或根据以往的信息可确认总体为正态分布时,不必进行正态性检验。

平稳性 '
平稳过程的概念在时间序列分析中一直占有重要地位。所谓平稳时间序列过程就是概率分布在如下意义上跨时期稳定的时间序列过程:如果从时间序列中任取一个变量集,并把这个序列向前移动 h 个时期,那么其联合联合概率分布保持不变。规范而言:

Kolmogorov-Smirnov 正态性检验
统计学里, Kolmogorov–Smirnov 检验(亦称:K–S 检验)是用来检验数据是否符合某种分布的一种非参数检验,通过比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布来判断是否符合检验假设。其原假设H0:两个数据分布一致或者数据符合理论分布。

ks.test 函数进行正态性检验的原假设为H0:数据符合正态分布。
D:D值越小,越接近0,表示样本数据越接近正态分布。
p:p-value小于显着性水平α(0.05),则拒绝H0,数据不服从正态分布。
ks.test的检验结果为:D=0.13781,p=0.4776>0.05,我们不能拒绝原假设H0,从而接受数据服从正态分布的原假设。

normalTest 检验:W=0.958,p=0.1995>0.05,因此不能拒绝服从正态分布的原假设,即该数据服从正态分布。 ksnormTest检验:D=0.1378,p=0.4776(双侧)>0.05,不能拒绝服从正态分布的原假设,即该数据服从正态分布。 殊途同归,不同的正态性检验方法,虽然的出的检验统计量的值和P值不同,但最终是否服从正态分布的检验结果是一致的。
注意:由于 K-S 检验不需要知道数据的分布情况,在小样本的统计分析中效果比较好。(大样本数据下,使用t-检验;小样本数据,使用t-检验会出现较大的偏差)

nortest 包中的正态性检验

lillie.test()正态性检验,它是对K-S正态性检验的的修正,适合大样本。

D值:D越小,越接近0,表示样本数据越接近正态分布
p值:如果p-value小于显着性水平α(0.05),则拒绝H0(服从正态分布)
根据 Lilliefor 正态性检验结果,检验统计量的值 D=0.20641,P< 2.2e-16<0.05。也就是说对中信证券股票日收盘价的数据正态性检验结果拒绝原假设,而接受数据服从非正态分布的备择假设,因而中信证券股票日收盘价的数据不服从正态分布。
Anderson–Darling检验是一种用来检验给定的样本是否来自于某个确定的概率分布的统计检验方法。

A 值:A 越小,越接近 0,表示样本数据越接近正态分布。
p 值:如果 p-value 小于显着性水平 α(0.05),则拒绝 H0(服从正态分布)。
根据 Anderson-Darling 正态性检验结果,检验统计量的值为 A=129.1, p值 < 2.2e-16<0.05,在 5% 的显着性水平上拒绝服从正态分布的原假设,而接受该时间序列数据服从正态分布的原假设,因而说明该时间序列数据不服从正态分布。
Cramer-von Mises测试是对正态性复合假设的EDF综合测试。

W 值:W 越小,越接近 0,表示样本数据越接近正态分布
p 值:如果 p-value 小于显着性水平 α(0.05),则拒绝H0(样本服从正态分布)
根据检验结果,检验统计量的值 W = 21.613, p 值= 7.37e-10<0.05,即在 5% 的显着性水平上拒绝服从正态分布的原假设,从而该时间序列不服从正态分布。
Pearsonchi-square检验基于理论频数与观测频数得到的。

p 值:P 越小,越接近 0,表示样本数据越接近正态分布
p-value:如果 p-value 小于显着性水平α(0.05),则拒绝服从正态分布的原假设。
根据检验结果,检验统计量的值 P=1850.6,p-value<2.2e-16<<0.05,因而拒绝服从正态分布的原假设,即该时间序列不服从正态分布。
Shapiro-Francia正态性检验的检验统计量只是有序样本值与来自标准正态分布的(近似)预期有序分位数之间的平方相关性。

W 值:W 越小,越接近 0,表示样本数据越接近正态分布
p 值:如果 p-value 小于显着性水平 α(0.05),则拒绝H0(样本服从正态分布)
根据本次检验结果,检验统计量的值 W = 0.74431, p-value<2.2e-16<<0.05,因而拒绝服从正态分布的原假设,故该时间序列不服从正态分布。
运用同一个时间序列进行正态性检验,不管运用那种检验方法,结果都是一致的,方法的改变并不会影响最终结果。

fBasics 包中的正态性检验
Shapiro-Wilk 是 Shapiro、Wilk 提出的用顺序统计量 W 来检验分布的正态性。

W 值:W 越小,越接近 0,表示样本数据越接近正态分布
p 值:如果 p-value 小于显着性水平 α(0.05),则拒绝H0(样本服从正态分布)
对分别满足正态分布和指数分布的数据进行正态性检验,检验结果: 正态分布(data2):p-value=0.4879>0.05,不能拒绝原假设,满足正态分布。 指数分布(data3):p-value<2.2e-16<<0.05,拒绝服从正态分布的原假设,该数据不满足正态分布。
D'Agostino正态性检验

STATISTIC:卡方检验统计量(Omnibus)、偏度检验统计量(Skewness)、峰度检验统计量(Kurtosis)。
P 值:卡方综合检验的 P 值、偏度检验的 P 值、峰度检验的 P 值。
由于正态分布的 Omnibus Test 的 P 值为 0.3423>0.05,即不能拒绝服从正态分布的原假设,说明实验很合理。而指数分布的Omnibus Test 的 P 值为2.2e-16<<0.05,股指数分布数据拒绝服从正态分布的原假设,这也符合常理。
Jarque-Bera 检验一种常用的正态性检验,针对大样本的一种正态性检验。

或者也可以用 tseries包中的 jarque.bera.test() 函数进行jarque-Bera正态性检验,检验结果一致。

X-squared 值:值越小,越接近 0,表示样本数据越接近正态分布
p 值:如果 p-value 小于显着性水平 α(0.05),则拒绝H0(样本服从正态分布)
据检验结果,正态分布的 P 值大于 0.05,指数分布的 P 值小于 0.05,检验结果非常合理。

正态QQ图
对数据进行正态性检验不仅可以使用以上的实验数学检验方法,还可以运用图形的方法,即绘制正态 QQ 图。

如果数据服从正态分布,则图形的所有点基本落在 45 度的对角线上,上图是正态分布的 QQ 图,显然所有点基本落在 45 度对角线上。

上图是指数分布的 QQ 图,显然指数分布的大部分点都没有落在 45 度对角线上,也就是说指数分布不服从正态分布。

平稳性检验是分析时间序列的基础操作,一般来说在进行时间序列数据的深入分析时,需要先检验该序列的平稳性才能进行后续的分析。平稳性检验有很多种方法,在本实验中利用中国农业银行的股票数据来介绍以下几种平稳性检验方法。
图形观察法
绘制时序图是检验时间序列平稳性最直观的方法,但是缺点是不够精确,有很大的主观性。

一个平稳的时间序列在图形上往往表现出一种围绕其均值不断波动的过程;
而非平稳序列则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降) 可以看到中国农业银行股票的日收盘价的时间序列波动性较大不同的时段有不同的趋势,明显是不平稳的。为此绘制了差分后的时序图,相对来说要平稳一些,但不能完全判定。
时间序列的平稳性还可以通过观察 ACF 图来进行判定。平稳时间序列的自相关函数(ACF)要么是截尾的,要么是拖尾的。因此我们可以根据这个特性来判断时间序列是否为平稳序列。

平稳时间序列:平稳时间序列的 K 阶滞后自相关系数都非常小,呈截现象,ACF 值基本在置信区间内。
非平稳时间序列:该序列具有上升或下降的趋势,对于所有短时滞来说,自相关系数大且为正,而且随着时滞k的增加而缓慢地下降。
从中国农业银行的股票日收盘价的 ACF图可以看出ACF随着k的增大而缓慢下降,自相关系数大且为正,因此该序列为非平稳时间序列。

单位根检验
单位根检验(unit root test)是针对各种时间序列中是否具有某种统计特性而提出的一种平稳性检验的特殊方法,单位根检验的方法有很多种,包括DF检验、ADF检验、PP检验等。
DF检验

由于检验统计量的值(Value of test-statistic)为-2.9374,大于 1%、5%、10% 的显着性水平上的临界值,即在 1%、5%、10% 的显着性水平上都不能拒绝存在单位根的原假设,因此该序列存在单位根,是非平稳时间序列。
ADF检验

根据 ADF 检验结果,DF=-2.5294,P 值为 0.3542>0.05,即在 5% 的显着性水平上,不能拒绝存在单位根的原假设,因此该时间序列是非平稳的。
PP检验

PP 检验所用到的 pp.test() 函数任旧来自于 tseries 包,原假设为:序列存在单位根。检验统计量的值为 -14.718,p 值为0.2888>0.05,因此在 5% 的显着性水平上不能拒绝原假设,该序列是非平稳时间序列。

❺ 时间序列平稳的三个条件

时间序列平稳的三个条件:

第一个条件,任意时刻二阶矩都存在。

第二个条件,随机变量的期望(一阶矩)不随时间的推移而改变。说白了就是,均值µ不随时间t改变。

第三个条件,两个时点的随机变量之间的自相关系数,只与这两个时点的时间差有关,而不随时间的推移而改变。

时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。平稳时间序列粗略地讲,一个时间序列,如果均值没有系统的变化(无趋势)、方差没有系统变化,且严格消除了周期性变化,就称之是平稳的。

❻ 如何深入理解时间序列分析中的平稳性

平稳不只是对很多实际过程的“简化”,还是我们的“追求”,是一条时间序列里面长期稳定不变的某些规律,是基本模型。

当面对不平稳的过程的时候,我们首先会想着去把这样的过程变换成平稳的,找出里面相对更不随时间变化的、更“平稳”的那些东西来,更平稳的序列有更低的 Order of integration 。当然,找出这些不变的(或者相对更平稳的)东西来之后,并不代表就一定可以获得真正意义上的预测能力。

举两个例子:

股票绝对价格的涨跌显然不能满足正态分布,Bachelier (1900) 当时就犯了这样的错误。当序列被 Osborne 处理过之后:,开始关注相对变化,这个序列才变得更“平稳”了。

反复做差分变换 ,直到时间序列变得“平稳”为止,做的差分变换的次数即为 Order of integration 。一条时间序列整体随时间变化的趋势消除,因而可以关注一些在整体变化之外的那些涨落,序列也因此变得相对更“平稳”。关于差分变换直至“平稳”的一个好例子就是“抑制了房价”“抑制了房价的增长”“抑制了房价增长的势头”“抑制了房价过快增长的势头”——经过多次差分变换,直到最终“抑制……增长”,得到了一条平稳的时间序列。

关于强平稳和弱平稳的差别:

强平稳是事实上的平稳(同分布);

弱平稳是统计量在观测意义上的平稳(均值、方差)。

第二个问题,均衡跟稳定没有关系。

国家规定了某个商品的价格,这情况完全不均衡,但是巨稳定。
一般均衡达到稳定,跟时间序列的稳定性还是两码事,例如矩可能不存在;又例如我选择的时间序列的时间间隔尺度远小于市场发生响应达到稳定的均衡的时间尺度,得到的序列还是可能是不稳定的。

❼ 时序分析平稳性分析

时间序列分析分为平稳时间序列分析和随机过程

按时间排序的一组随机数变量,可以用数学语言表示如下

上面小写 x 表示在从下面大 X 总体得到的观察值,这里 t 表示某一个时刻,每一时刻 t 都是对应一个随机变量,而小写 x 是随机样本在 t 时刻观察值。

在统计学中,通常用大写字母表示样本总体,而用小写的 x 表示样本的个体。

虽然我们可以机器学习方法或者深度学习方法来解决时间序列的问题,但是实际应用中,时间序列问题应该更偏重于数理统计的范畴。所以利用统计学中针对不同时间序列二设计模型解决时间序列问题,可以更有效地解决时间序列问题。

在时间序列中,每一个时刻值 t 都是一个随机变量,因为是随机变量,那么就有概率密度函数表示如下,每一个 都服从一个概率密度函数。

对于没有学习过概率和统计的朋友,这里理解上有些困难需要补充一下相应的知识。

下面介绍用于描述一个总体分布情况的特征统计量,这里说的很正是,但是理解上应该不难。

这些式子其实不难就是,可能大家看了难于理解部分在对密度函数就积分来表示均值和方差,我们通常样本是离散的,通过对样本求和除以样本数就可以近似得到总体均值,也就是总体数学期望,所谓期望就是均值。

还有自协方差,因为时间序列是随机变量组,所以这里自表示对来源同一个随机变量组两个随机变量间的协方差。

这里 就是 s 时刻随机变量的均值。

时间序列难点就是我们仅可以观察到某一个随机变量一个观察值,例如股票在某一天值,我们只能得到一个观察值,某地区年平均降雨量也只能得到一个观察值,这样同很难像以往我们通过大量样本来估计总体的方式来解决时间序列问题。

对于一个数字,均值就是他自己,方差为 0 而且问题如何求一个数的协方差。这也就是时间序列难点所在。

为了解决时间序列,我们引入平稳的概念,通过一种假设或者说限制来降低时间序列研究难度,这就是为什么我们要引入平稳概念到时间序列原因。

时间序列分析理论中有两种平稳性定义

因为严平稳只是概念存在,实际研究价值不大,随意我们主要研究就是宽平稳。有关宽平稳定义在之前分享已经提及了,这里就不再赘述了,重点回顾一下什么是宽平稳以及他的特点,宽平稳定义不说了,大家觉得难应该是宽平稳的几个特性,也就是如何定义宽平稳。

说明每一个随机变量的均值都是一个常数

这表示在时间序列中两个随机变量的自协方差与跨度有关

这里我们想一想如何用一个随机变量和其自己做协方差相关系数,

我们这里所说随机性检验是建立在平稳序列基础之上,只有满足了平稳性

所谓平稳性时间序列,虽然每一 t 时刻随机变量都是独立,但是他们具有相似性,都服从相似的分布,所以才能够研究时间序列。

这里我们想一想如何计算相邻两个随机变量间自协方差,和其自己做协方差相关系数,原来对于 x 在 1 时刻只有一个观测值,因为在不同时刻 X 分布近似,我们通过借用其他时刻的随机变量观测值来组成一个向量表示随机样本。借用其他时刻前提就是需要我们时间序列平稳,这也就是我们为什么要研究平稳性的原因。

通过上面方法我们还可以得到另一个 2 时刻 X 随机样本。

因为是平稳序列,我们之前已经知道平稳序列的一个特点也就是跨度相同时间序列随机变量间的自相关系数相同。在平稳时间序列中,时间距离比较近随机变量间的自相关系数要大于距离较远随机变量间的相关系数。

上面我们说了通过假定为平稳的时间序列更加便于研究,那么如何判断一个时间序列是平稳的时间序列呢,这就是接下来我们要讨论的内容。

我们这里所说随机性检验是建立在平稳序列基础之上,只有满足了平稳性。如果是随机就说明随机变量间没有信息的传递。如果序列是随机,那么随机变量就没有可以分析价值,但是并不是说我们就没有办法了,这里还有一本书随机过程来处理随机序列。这是一门研究生课程用于专门研究随机过程。随机时间序列也是可以看作白噪声,接下来我们数学方式描述一下

从上面来看自相关系数为 0 表示没有每一两个随机变量间都是没有关系的,也就是信息向下传递。图像处理,研究一些波或者信号处理都用到白噪声。
检验白噪声就是检验序列是否为平稳的,只有平稳时间序列才能算上平稳时间序列。

❽ 度量股票市场的波动性有哪些常见方法

1.首先你要知道股票的数据是时间序列数据。
经研究表明,股票数据是有自相关性的,所以古典的回归模型拟合常常是无效的。

2.另外股票数据序列是具有平稳性,或一阶差分、高阶差分平稳性
所以一般来说都会采用平稳性时间序列模型。
简单的如AR(p), MA(q), ARMA(p,q)模型等。

3.但由于这些数据往往还有条件异方差性。进一步的模型修正
有ARCH(p) , GARCH(p,q)等模型。

3中的模型是现今一些研究股票波动的主流手段的基础。

4.如果要研究多支股票波动的联合分布,可以用Copula理论进行建模(这个一般用于VaR,ES风险度量,比较前沿,国内90年代才开始引进,但并不算太难)

5.另外还有一些非实证的手段,那是搞数学的弄的了

❾ 时间序列基础

1.随机时序分析的基本概念
1)随机变量:简单的随机现象,如某班一天学生出勤人数,是静态的。
2)随机过程:随机现象的动态变化过程。动态的。如某一时期各个时刻的状态。
所谓随机过程,就是说现象的变化没有确定形式,没有必然的变化规律。用数学语言来说,就是事物变化的过程不能用一个(或几个)时间t的确定的函数来描述。
如果对于每一特定的t属于T(T是时间集合),X(t)是一个随机变量,则称这一族无穷多个随机变量{X(t),t属于T}是一个随机过程。

2.白噪声序列
1)纯随机过程:随机变量X(t)(t=1,2,3……),如果是由一个不相关的随机变量的序列构成的,即对于所有s不等于k,随机变量Xs和Xk的协方差为零,则称其为 纯随机过程
2)白噪声过程:如果一个纯随机过程的期望和方差均为常数,则称之为 白噪声过程 。白噪声过程的样本实称成为白噪声序列,简称白噪声。
3)高斯白噪声序列:如果白噪声具体是服从均值为0、方差为常数的正态分布,那就是 高斯白噪声序列

3.平稳性序列
1)平稳性可以说是时间序列分析的基础。平稳的通俗理解就是时间序列的一些行为不随时间改变, 所谓平稳过程就是其统计特性不随时间的平移而变化的过程。
2)即时间序列内含的规律和逻辑,要在被预测的未来时间段内能够延续下去。这样我们才能用历史信息去预测未来信息,类似机器学习中的训练集和测试集同分布。
3)如果时间序列的变化是没有规律的、完全随机的,那么预测模型也就没有用。
4)平稳性的数学表达:如果时间序列在某一常数附近波动且波动范围有限,即有常数均值和常数方差,并且延迟k期的序列变量的自协方差和自相关系数是相等的或者说延迟k期的序列变量之间的影响程度是一样的,则称该序列为平稳序列。简单说就是没有明显趋势且波动范围有限。

4.严平稳/强平稳
1)通俗来说,就是时间序列的联合分布随着时间变化严格保持不变。
2)数学表达:如果对所有的时刻 t, (yt1,yt2,…ytm)的联合分布与(y(t1+k),(yt2+k),…y(tm+k))的联合分布相同,我们称时间序列 {yt} 是严平稳的。也就是时间序列的联合分布在时间的平移变换下保持不变。

5.弱平稳
1)数学表达:均值不变,协方差Cov(yt,y(t-k))=γk,γk依赖于k。
2)即协方差也不随时间改变,而仅与时间差k相关。
3)可以根据根据时间序列的折线图等大致观察数据的(弱)平稳性:*所有数据点在一个常数水平上下以相同幅度波动。
4)弱平稳的线性时间序列具有短期相关性(证明见参考书),即通常只有近期的序列值对现时值得影响比较明显,间隔越远的过去值对现时值得影响越小。至于这个间隔,也就是下面要提到的模型的阶数。

6.严平稳和弱平稳的关系
1)严平稳是一个很强的条件,难以用经验的方法验证,所以一般将弱平稳性作为模型的假设条件。
2)两者并不是严格的包含与被包含关系,但当时间序列是正态分布时,二者等价。

7.单位根非平稳序列(可转换为平稳序列的非平稳序列)
在金融数据中,通常假定资产收益率序列是弱平稳的。但还有一些研究对象,比如利率、汇率、资产的价格序列,往往不是平稳的。对于资产的价格序列,其非平稳性往往由于价格没有固定的水平,这样的非平稳序列叫做单位根(unit-root)非平稳序列。
1)最着名的单位根非平稳序列的例子是随机游走(random walk)模型:
pt=μ+p(t-1)+εt
μ是常数项(漂移:drift)。εt是白噪声序列,则pt就是一个随机游走。它的形式和AR模型很像,但不同之处在于,AR模型中,系数的模需要小于1,这是AR的平稳性条件,而随机游走相当于系数为1的AR公式,不满足AR模型的平稳性条件。
随机游走模型可作为(对数)股价运动的统计模型,在这样的模型下,股价是不可预测的。因为εt关于常数对称,所以在已知p(t-1)的条件下,pt上升或下降的概率都是50%,无从预测。
2)带趋势项的时间序列
pt=β0+β1*t+yt,yt是一个平稳时间序列。
带漂移的随机游走模型,其均值和方差都随时间变化;而带趋势项的时间序列,其均值随时间变化,但方差则是不变的常数。
单位根非平稳序列可以进行平稳化处理转换为平稳序列。比如用差分法处理随机游走序列,用用简单的回归分析移除时间趋势处理带趋势项的时间序列。

建立具体的模型,需解决如下三个问题模型的具体形式、时序变量的滞后期以及随机扰动项的结构。

μ是yt的均值;ψ是系数,决定了时间序列的线性动态结构,也被称为权重,其中ψ0=1;{εt}为高斯白噪声序列,它表示时间序列{yt}在t时刻出现了新的信息,所以εt称为时刻t的innovation(新信息)或shock(扰动)。
线性时间序列模型,就是描述线性时间序列的权重ψ的计量经济模型或统计模型,比如ARIMA。因为并非所有金融数据都是线性的,所以不是所有金融数据都适合ARIMA等模型。

①自回归模型(AR)
用变量自身的历史时间数据对变量进行回归,从而预测变量未来的时间数据。
p阶(滞后值,可暂理解为每个移动窗口有p期)自回归公式即AR(p):

②移动平均模型(MA)
移动平均模型关注的是误差项的累加,能够有效消除预测中的随机波动。
可以看作是白噪声序列的简单推广,是白噪声序列的有限线性组合。也可以看作是参数受到限制的无穷阶AR模型。

③自回归移动平均模型(ARMA)
有时候,要用很多阶数的AR和MA模型(见后面的定阶问题),为解决这个问题提出ARMA模型。
对于金融中的收益率序列,直接使用ARMA模型的时候较少,但其概念与波动率建模很相关,GARCH模型可以认为是对{εt}的ARMA模型。

④自回归差分移动平均模型(ARIMA)
ARIMA比ARMA仅多了个"I",代表的含义可理解为 差分。
一些非平稳序列经过d次差分后,可以转化为平稳时间序列。我们对差分1次后的序列进行平稳性检验,若果是非平稳的,则继续差分。直到d次后检验为平稳序列。

⑤一般分析过程
1、 平稳性检验
ADF检验(单位根检验):这是一种检查数据稳定性的统计测试。
原假设(无效假设):时间序列是不稳定的。
2、 平稳化处理
平稳化的基本思路是:通过建模并估计趋势和季节性这些因素,并从时间序列中移除,来获得一个稳定的时间序列,然后再使用统计预测技术来处理时间序列,最后将预测得到的数据,通过加入趋势和季节性等约束,来还原到原始时间序列数据。
2.0 对数变换
对某些时间序列需要取对数处理,一是可以将一些指数增长的时间序列变成线性增长,二是可以稳定序列的波动性。对数变换在经济金融类时间序列中常用。
2.1 差分法
如果是单位根非平稳的(比如随机游走模型),可以对其进行差分化。它能让数据呈现一种更加平稳的趋势。差分阶数的选择通常越小越好,只要能够使得序列稳定就行。
2.2 平滑法
移动平均、指数加权移动平均
注:经差分或平滑后的数据可能因包含缺失值而不能使用检验,需要将缺失值去除
2.3 分解法
建立有关趋势和季节性的模型,并从模型中删除它们。
3 、建立模型:模型选择和模型的定阶
模型的选择即在AR、MA、ARMA、ARIMA中间如何选择。
模型的定阶即指定上面过程中产生的超参数p、q和d(差分的阶数)。
(1)用ACF和PACF图判断使用哪种线性时间序列模型
AR模型:ACF拖尾,PACF截尾,看PACF定阶。
MA模型:ACF截尾,PACF拖尾,看ACF定阶。
ARMA模型:都拖尾。(EACF定阶)
截尾:在某阶后 迅速 趋于0(后面大部分阶的对应值在二倍标准差以内);
拖尾:按指数衰减或震荡,值到后面还有增大的情况。
ARIMA模型:适用于差分后平稳的序列。
(2)利用 信息准则 函数选择合适的阶
对于个数不多的时序数据,可以通过观察自相关图和偏相关图来进行模型识别,倘若要分析的时序数据量较多,例如要预测每只股票的走势,就不可能逐个去调参了。这时可以依据AIC或BIC准则识别模型的p, q值,通常认为AIC或BIC值越小的模型相对更优。
AIC或BIC准则综合考虑了残差大小和自变量的个数,残差越小AIC或BIC值越小,自变量个数越多AIC或BIC值越大。AIC或BIC准则可以说是对模型过拟合设定了一个标准。
AIC (Akaike information criterion,赤池信息度量准则)
AIC=2k-2ln(L)
· BIC (Bayesian information criterion,贝叶斯信息度量准则)
BIC=kln(n)-2ln(L)
k为模型的超参数个数,n为样本数量,L为似然函数。
类比机器学习中的损失函数=经验损失函数+正则化项。
模型选择标准:AIC和BIC越小越好(在保证精度的情况下模型越简单越好)
4 、模型检验和评估(之前应切分训练集和验证集)
检验残差是否符合标准(QQ图):是否服从均值为0,方差是常数的正态分布(εt是否是高斯白噪声序列)。
拟合优度检验(模型的评估):R 2和调整后的R 2(R^2只适用于平稳序列)。
5 、预测
如果之前进行了标准化、差分化等,需要进行还原:
标准化的还原要注意是log(x+1)还是log(x)。

1 、基础概念
波动率
在期权交易中,波动率是标的资产的收益率的条件标准差。之前的平稳序列假设方差为常数,但当序列的方差不是常数时,我们需要用波动率对其变化进行描述。
对于金融时间序列,波动率往往具有以下特征:
存在波动率聚集(volatility cluster)现象。 即波动率在一些 时间段 上高,一些时间段上低。
波动率以连续时间变化,很少发生跳跃。
波动率不会发散到无穷,而是在固定的范围内变化(统计学角度上说,其是平稳的)
杠杆效应:波动率对价格大幅上升和大幅下降的反应是不同的。
波动率模型/条件异方差模型
给资产收益率的波动率进行建模的模型叫做条件异方差模型。这些波动率模型试图刻画的数据有这样的特性: 它们是序列不相关或低阶序列相关的(比如股票的日收益率可能相关,但月收益率则无关),但又不是独立的 。波动率模型就是试图刻画序列的这种非独立性。
定义信息集F(t-1)是包含过去收益率的一切线性函数,假定F(t-1)给定,那么在此条件下时间序列yt的条件均值和条件方差分别表示为:

❿ 如何用判断时间序列是否平稳呢

首先绘制时序图,观察是否存在波动和向上或向下的趋势
然后做相关系数图,若随k增大,自相关系数迅速衰减则序列平稳;若随k增大,自相关系数衰减缓慢则序列不平稳
最后进行单位根检验,P-值<α时,拒绝存在单位根的原假设,序列平稳。