當前位置:首頁 » 股票盈虧 » 股票價格時間序列是否平穩
擴展閱讀
設計總院股票歷史股價 2023-08-31 22:08:17
股票開通otc有風險嗎 2023-08-31 22:03:12
短線買股票一天最好時間 2023-08-31 22:02:59

股票價格時間序列是否平穩

發布時間: 2022-12-10 17:22:40

❶ 非平穩時間序列可以預測股票走勢嗎

一般把非平穩時間序列轉化為平穩時間序列的方法是取n階差分法。

比如舉個例子,假設xt本身是不平穩的時間序列,如果xt~I(1) ,也就是說x的1階差分是平穩序列。
那麼 xt的1階差分dxt=x(t)-x(t-1) 就是平穩的序列 這時dt=x(t-1)

如果xt~I(2),就是說xt的2階差分是平穩序列的話
xt的1n階差分dxt=x(t)-x(t-1) 這時xt的1階差分依然不平穩,
那麼 對xt的1階差分再次差分後,
xt的2階差分ddxt=dxt-dxt(t-1)便是平穩序列 這時dt=-x(t-1)-dxt(t-1)

n階的話可以依次類推一下。

❷ arima模型python 怎麼看平穩性

時間序列分析(一) 如何判斷序列是否平穩
序列平穩不平穩,一般採用兩種方法:
第一種:看圖法
圖是指時序圖,例如(eviews畫滴):

分析:什麼樣的圖不平穩,先說下什麼是平穩,平穩就是圍繞著一個常數上下波動。
看看上面這個圖,很明顯的增長趨勢,不平穩。

第二種:自相關系數和偏相關系數
還以上面的序列為例:用eviews得到自相關和偏相關圖,Q統計量和伴隨概率。

分析:判斷平穩與否的話,用自相關圖和偏相關圖就可以了。
平穩的序列的自相關圖和偏相關圖不是拖尾就是截尾。截尾就是在某階之後,系數都為 0 ,怎麼理解呢,看上面偏相關的圖,當階數為 1 的時候,系數值還是很大, 0.914. 二階長的時候突然就變成了 0.050. 後面的值都很小,認為是趨於 0 ,這種狀況就是截尾。再就是拖尾,拖尾就是有一個衰減的趨勢,但是不都為 0 。
自相關圖既不是拖尾也不是截尾。以上的圖的自相關是一個三角對稱的形式,這種趨勢是單調趨勢的典型圖形。

下面是通過自相關的其他功能
如果自相關是拖尾,偏相關截尾,則用 AR 演算法
如果自相關截尾,偏相關拖尾,則用 MA 演算法
如果自相關和偏相關都是拖尾,則用 ARMA 演算法, ARIMA 是 ARMA 演算法的擴展版,用法類似 。
不平穩,怎麼辦?
答案是差分
還是上面那個序列,兩種方法都證明他是不靠譜的,不平穩的。確定不平穩後,依次進行1階、2階、3階...差分,直到平穩位置。先來個一階差分,上圖。

從圖上看,一階差分的效果不錯,看著是平穩的。

❸ 如何深入理解時間序列分析中的平穩性

聲明:本文中所有引用部分,如非特別說明,皆引自Time Series Analysis with Applications in R.

接觸時間序列分析才半年,盡力回答。如果回答有誤,歡迎指出。

對第一個問題,我們把它拆分成以下兩個問題:

Why stationary?(為何要平穩?)
Why weak stationary?(為何弱平穩?)

Why stationary?(為何要平穩?)
每一個統計學問題,我們都需要對其先做一些基本假設。如在一元線性回歸中(),我們要假設:①不相關且非隨機(是固定值或當做已知)②獨立同分布服從正態分布(均值為0,方差恆定)。

在時間序列分析中,我們考慮了很多合理且可以簡化問題的假設。而其中最重要的假設就是平穩。
The basic idea of stationarity is that the probability laws that govern the behavior of the process do not change over time.
平穩的基本思想是:時間序列的行為並不隨時間改變。
正因此,我們定義了兩種平穩:
Strict stationarity: A time series {} is said to be strictly stationary if the joint distribution of ,, · · ·, is the same as that of,, · · · ,for all choices of natural number n, all choices of time points ,, · · · , and all choices of time lag k.
強平穩過程:對於所有可能的n,所有可能的,, · · · , 和所有可能的k,當,, · · ·,的聯合分布與,, · · · ,相同時,我們稱其強平穩。
Weak stationarity: A time series {} is said to be weakly (second-order, or co-variance) stationary if:
① the mean function is constant over time, and
② γ(t, t − k) = γ(0, k) for all times t and lags k.
弱平穩過程:當①均值函數是常數函數且②協方差函數僅與時間差相關,我們才稱其為弱平穩。
此時我們轉到第二個問題:Why weak stationary?(為何弱平穩?)
我們先來說說兩種平穩的差別:

兩種平穩過程並沒有包含關系,即弱平穩不一定是強平穩,強平穩也不一定是弱平穩。
一方面,雖然看上去強平穩的要求好像比弱平穩強,但強平穩並不一定是弱平穩,因為其矩不一定存在。
例子:{}獨立服從柯西分布。{}是強平穩,但由於柯西分布期望與方差不存在,所以不是弱平穩。(之所以不存在是因為其並非絕對可積。)
另一方面,弱平穩也不一定是強平穩,因為二階矩性質並不能確定分布的性質。
例子:,,互相獨立。這是弱平穩卻不是強平穩。

知道了這些造成差別的根本原因後,我們也可以寫出兩者的一些聯系:

一階矩和二階矩存在時,強平穩過程是弱平穩過程。(條件可簡化為二階矩存在,因為)
當聯合分布服從多元正態分布時,兩平穩過程等價。(多元正態分布的二階矩可確定分布性質)

而為什麼用弱平穩而非強平穩,主要原因是:強平穩條件太強,無論是從理論上還是實際上。
理論上,證明一個時間序列是強平穩的一般很難。正如定義所說,我們要比較,對於所有可能的n,所有可能的,, · · · , 和所有可能的k,當,, · · ·,的聯合分布與,, · · · ,相同。當分布很復雜的時候,不僅很難比較所有可能性,也可能很難寫出其聯合分布函數。
實際上,對於數據,我們也只能估算出它們均值和二階矩,我們沒法知道它們的分布。所以我們在以後的模型構建和預測上都是在用ACF,這些性質都和弱項和性質有關。而且,教我時間序列教授說過:"General linear process(weak stationarity, linearity, causality) covers about 10% of the real data." ,如果考慮的是強平穩,我覺得可能連5%都沒有了。

對第二個問題:
教授有天在審本科畢業論文,看到一個寫金融的,用平穩時間序列去估計股票走勢(真不知這老兄怎麼想的)。當時教授就說:「金融領域很多東西之所以難以估計,就是因為其經常突變,根本就不是平穩的。」
果不其然,論文最後實踐階段,對於股票選擇的正確率在40%。連期望50%都不到(任意一點以後要麼漲要麼跌)。

暑假裡自己用了一些時間序列的方法企圖開發程序性交易程序。
剛開始收益率還好,越往後就越...後面直接虧損了...(軟體是金字塔,第二列是利潤率)

虧損的圖當時沒截,現在也沒法補了,程序都刪了。
所以應該和平穩沒關系吧,畢竟我的做法也沒假設是平穩的。如果平穩我就不會之後不盈利了。
(吐槽)自己果然不適合做股票、期貨什麼的...太高端理解不能...

❹ 19正態性和平穩性檢驗

** 正態分布與正態性檢驗**
正態分布(Normal distribution),也稱「常態分布」,又名高斯分布(Gaussian distribution)。正態分布是具有兩個參數 μ 和 σ^2 的連續型隨機變數的分布,第一參數 μ 是服從正態分布的隨機變數的均值,第二個參數 σ^2 是此隨機變數的方差。

正態性檢驗(Normality Test)是一種特殊的假設檢驗,是檢驗一批觀測值(或對觀測值進行函數變換後的數據)或一批隨機數是否來自正態總體,是否服從正態分布。這是當基於正態性假定進行統計分析時,如果懷疑總體分布的正態性,應進行正態性檢驗。但當有充分理論依據或根據以往的信息可確認總體為正態分布時,不必進行正態性檢驗。

平穩性 '
平穩過程的概念在時間序列分析中一直佔有重要地位。所謂平穩時間序列過程就是概率分布在如下意義上跨時期穩定的時間序列過程:如果從時間序列中任取一個變數集,並把這個序列向前移動 h 個時期,那麼其聯合聯合概率分布保持不變。規范而言:

Kolmogorov-Smirnov 正態性檢驗
統計學里, Kolmogorov–Smirnov 檢驗(亦稱:K–S 檢驗)是用來檢驗數據是否符合某種分布的一種非參數檢驗,通過比較一個頻率分布f(x)與理論分布g(x)或者兩個觀測值分布來判斷是否符合檢驗假設。其原假設H0:兩個數據分布一致或者數據符合理論分布。

ks.test 函數進行正態性檢驗的原假設為H0:數據符合正態分布。
D:D值越小,越接近0,表示樣本數據越接近正態分布。
p:p-value小於顯著性水平α(0.05),則拒絕H0,數據不服從正態分布。
ks.test的檢驗結果為:D=0.13781,p=0.4776>0.05,我們不能拒絕原假設H0,從而接受數據服從正態分布的原假設。

normalTest 檢驗:W=0.958,p=0.1995>0.05,因此不能拒絕服從正態分布的原假設,即該數據服從正態分布。 ksnormTest檢驗:D=0.1378,p=0.4776(雙側)>0.05,不能拒絕服從正態分布的原假設,即該數據服從正態分布。 殊途同歸,不同的正態性檢驗方法,雖然的出的檢驗統計量的值和P值不同,但最終是否服從正態分布的檢驗結果是一致的。
注意:由於 K-S 檢驗不需要知道數據的分布情況,在小樣本的統計分析中效果比較好。(大樣本數據下,使用t-檢驗;小樣本數據,使用t-檢驗會出現較大的偏差)

nortest 包中的正態性檢驗

lillie.test()正態性檢驗,它是對K-S正態性檢驗的的修正,適合大樣本。

D值:D越小,越接近0,表示樣本數據越接近正態分布
p值:如果p-value小於顯著性水平α(0.05),則拒絕H0(服從正態分布)
根據 Lilliefor 正態性檢驗結果,檢驗統計量的值 D=0.20641,P< 2.2e-16<0.05。也就是說對中信證券股票日收盤價的數據正態性檢驗結果拒絕原假設,而接受數據服從非正態分布的備擇假設,因而中信證券股票日收盤價的數據不服從正態分布。
Anderson–Darling檢驗是一種用來檢驗給定的樣本是否來自於某個確定的概率分布的統計檢驗方法。

A 值:A 越小,越接近 0,表示樣本數據越接近正態分布。
p 值:如果 p-value 小於顯著性水平 α(0.05),則拒絕 H0(服從正態分布)。
根據 Anderson-Darling 正態性檢驗結果,檢驗統計量的值為 A=129.1, p值 < 2.2e-16<0.05,在 5% 的顯著性水平上拒絕服從正態分布的原假設,而接受該時間序列數據服從正態分布的原假設,因而說明該時間序列數據不服從正態分布。
Cramer-von Mises測試是對正態性復合假設的EDF綜合測試。

W 值:W 越小,越接近 0,表示樣本數據越接近正態分布
p 值:如果 p-value 小於顯著性水平 α(0.05),則拒絕H0(樣本服從正態分布)
根據檢驗結果,檢驗統計量的值 W = 21.613, p 值= 7.37e-10<0.05,即在 5% 的顯著性水平上拒絕服從正態分布的原假設,從而該時間序列不服從正態分布。
Pearsonchi-square檢驗基於理論頻數與觀測頻數得到的。

p 值:P 越小,越接近 0,表示樣本數據越接近正態分布
p-value:如果 p-value 小於顯著性水平α(0.05),則拒絕服從正態分布的原假設。
根據檢驗結果,檢驗統計量的值 P=1850.6,p-value<2.2e-16<<0.05,因而拒絕服從正態分布的原假設,即該時間序列不服從正態分布。
Shapiro-Francia正態性檢驗的檢驗統計量只是有序樣本值與來自標准正態分布的(近似)預期有序分位數之間的平方相關性。

W 值:W 越小,越接近 0,表示樣本數據越接近正態分布
p 值:如果 p-value 小於顯著性水平 α(0.05),則拒絕H0(樣本服從正態分布)
根據本次檢驗結果,檢驗統計量的值 W = 0.74431, p-value<2.2e-16<<0.05,因而拒絕服從正態分布的原假設,故該時間序列不服從正態分布。
運用同一個時間序列進行正態性檢驗,不管運用那種檢驗方法,結果都是一致的,方法的改變並不會影響最終結果。

fBasics 包中的正態性檢驗
Shapiro-Wilk 是 Shapiro、Wilk 提出的用順序統計量 W 來檢驗分布的正態性。

W 值:W 越小,越接近 0,表示樣本數據越接近正態分布
p 值:如果 p-value 小於顯著性水平 α(0.05),則拒絕H0(樣本服從正態分布)
對分別滿足正態分布和指數分布的數據進行正態性檢驗,檢驗結果: 正態分布(data2):p-value=0.4879>0.05,不能拒絕原假設,滿足正態分布。 指數分布(data3):p-value<2.2e-16<<0.05,拒絕服從正態分布的原假設,該數據不滿足正態分布。
D'Agostino正態性檢驗

STATISTIC:卡方檢驗統計量(Omnibus)、偏度檢驗統計量(Skewness)、峰度檢驗統計量(Kurtosis)。
P 值:卡方綜合檢驗的 P 值、偏度檢驗的 P 值、峰度檢驗的 P 值。
由於正態分布的 Omnibus Test 的 P 值為 0.3423>0.05,即不能拒絕服從正態分布的原假設,說明實驗很合理。而指數分布的Omnibus Test 的 P 值為2.2e-16<<0.05,股指數分布數據拒絕服從正態分布的原假設,這也符合常理。
Jarque-Bera 檢驗一種常用的正態性檢驗,針對大樣本的一種正態性檢驗。

或者也可以用 tseries包中的 jarque.bera.test() 函數進行jarque-Bera正態性檢驗,檢驗結果一致。

X-squared 值:值越小,越接近 0,表示樣本數據越接近正態分布
p 值:如果 p-value 小於顯著性水平 α(0.05),則拒絕H0(樣本服從正態分布)
據檢驗結果,正態分布的 P 值大於 0.05,指數分布的 P 值小於 0.05,檢驗結果非常合理。

正態QQ圖
對數據進行正態性檢驗不僅可以使用以上的實驗數學檢驗方法,還可以運用圖形的方法,即繪制正態 QQ 圖。

如果數據服從正態分布,則圖形的所有點基本落在 45 度的對角線上,上圖是正態分布的 QQ 圖,顯然所有點基本落在 45 度對角線上。

上圖是指數分布的 QQ 圖,顯然指數分布的大部分點都沒有落在 45 度對角線上,也就是說指數分布不服從正態分布。

平穩性檢驗是分析時間序列的基礎操作,一般來說在進行時間序列數據的深入分析時,需要先檢驗該序列的平穩性才能進行後續的分析。平穩性檢驗有很多種方法,在本實驗中利用中國農業銀行的股票數據來介紹以下幾種平穩性檢驗方法。
圖形觀察法
繪制時序圖是檢驗時間序列平穩性最直觀的方法,但是缺點是不夠精確,有很大的主觀性。

一個平穩的時間序列在圖形上往往表現出一種圍繞其均值不斷波動的過程;
而非平穩序列則往往表現出在不同的時間段具有不同的均值(如持續上升或持續下降) 可以看到中國農業銀行股票的日收盤價的時間序列波動性較大不同的時段有不同的趨勢,明顯是不平穩的。為此繪制了差分後的時序圖,相對來說要平穩一些,但不能完全判定。
時間序列的平穩性還可以通過觀察 ACF 圖來進行判定。平穩時間序列的自相關函數(ACF)要麼是截尾的,要麼是拖尾的。因此我們可以根據這個特性來判斷時間序列是否為平穩序列。

平穩時間序列:平穩時間序列的 K 階滯後自相關系數都非常小,呈截現象,ACF 值基本在置信區間內。
非平穩時間序列:該序列具有上升或下降的趨勢,對於所有短時滯來說,自相關系數大且為正,而且隨著時滯k的增加而緩慢地下降。
從中國農業銀行的股票日收盤價的 ACF圖可以看出ACF隨著k的增大而緩慢下降,自相關系數大且為正,因此該序列為非平穩時間序列。

單位根檢驗
單位根檢驗(unit root test)是針對各種時間序列中是否具有某種統計特性而提出的一種平穩性檢驗的特殊方法,單位根檢驗的方法有很多種,包括DF檢驗、ADF檢驗、PP檢驗等。
DF檢驗

由於檢驗統計量的值(Value of test-statistic)為-2.9374,大於 1%、5%、10% 的顯著性水平上的臨界值,即在 1%、5%、10% 的顯著性水平上都不能拒絕存在單位根的原假設,因此該序列存在單位根,是非平穩時間序列。
ADF檢驗

根據 ADF 檢驗結果,DF=-2.5294,P 值為 0.3542>0.05,即在 5% 的顯著性水平上,不能拒絕存在單位根的原假設,因此該時間序列是非平穩的。
PP檢驗

PP 檢驗所用到的 pp.test() 函數任舊來自於 tseries 包,原假設為:序列存在單位根。檢驗統計量的值為 -14.718,p 值為0.2888>0.05,因此在 5% 的顯著性水平上不能拒絕原假設,該序列是非平穩時間序列。

❺ 時間序列平穩的三個條件

時間序列平穩的三個條件:

第一個條件,任意時刻二階矩都存在。

第二個條件,隨機變數的期望(一階矩)不隨時間的推移而改變。說白了就是,均值µ不隨時間t改變。

第三個條件,兩個時點的隨機變數之間的自相關系數,只與這兩個時點的時間差有關,而不隨時間的推移而改變。

時間序列是指將某種現象某一個統計指標在不同時間上的各個數值,按時間先後順序排列而形成的序列。平穩時間序列粗略地講,一個時間序列,如果均值沒有系統的變化(無趨勢)、方差沒有系統變化,且嚴格消除了周期性變化,就稱之是平穩的。

❻ 如何深入理解時間序列分析中的平穩性

平穩不只是對很多實際過程的「簡化」,還是我們的「追求」,是一條時間序列裡面長期穩定不變的某些規律,是基本模型。

當面對不平穩的過程的時候,我們首先會想著去把這樣的過程變換成平穩的,找出裡面相對更不隨時間變化的、更「平穩」的那些東西來,更平穩的序列有更低的 Order of integration 。當然,找出這些不變的(或者相對更平穩的)東西來之後,並不代表就一定可以獲得真正意義上的預測能力。

舉兩個例子:

股票絕對價格的漲跌顯然不能滿足正態分布,Bachelier (1900) 當時就犯了這樣的錯誤。當序列被 Osborne 處理過之後:,開始關注相對變化,這個序列才變得更「平穩」了。

反復做差分變換 ,直到時間序列變得「平穩」為止,做的差分變換的次數即為 Order of integration 。一條時間序列整體隨時間變化的趨勢消除,因而可以關注一些在整體變化之外的那些漲落,序列也因此變得相對更「平穩」。關於差分變換直至「平穩」的一個好例子就是「抑制了房價」「抑制了房價的增長」「抑制了房價增長的勢頭」「抑制了房價過快增長的勢頭」——經過多次差分變換,直到最終「抑制……增長」,得到了一條平穩的時間序列。

關於強平穩和弱平穩的差別:

強平穩是事實上的平穩(同分布);

弱平穩是統計量在觀測意義上的平穩(均值、方差)。

第二個問題,均衡跟穩定沒有關系。

國家規定了某個商品的價格,這情況完全不均衡,但是巨穩定。
一般均衡達到穩定,跟時間序列的穩定性還是兩碼事,例如矩可能不存在;又例如我選擇的時間序列的時間間隔尺度遠小於市場發生響應達到穩定的均衡的時間尺度,得到的序列還是可能是不穩定的。

❼ 時序分析平穩性分析

時間序列分析分為平穩時間序列分析和隨機過程

按時間排序的一組隨機數變數,可以用數學語言表示如下

上面小寫 x 表示在從下面大 X 總體得到的觀察值,這里 t 表示某一個時刻,每一時刻 t 都是對應一個隨機變數,而小寫 x 是隨機樣本在 t 時刻觀察值。

在統計學中,通常用大寫字母表示樣本總體,而用小寫的 x 表示樣本的個體。

雖然我們可以機器學習方法或者深度學習方法來解決時間序列的問題,但是實際應用中,時間序列問題應該更偏重於數理統計的范疇。所以利用統計學中針對不同時間序列二設計模型解決時間序列問題,可以更有效地解決時間序列問題。

在時間序列中,每一個時刻值 t 都是一個隨機變數,因為是隨機變數,那麼就有概率密度函數表示如下,每一個 都服從一個概率密度函數。

對於沒有學習過概率和統計的朋友,這里理解上有些困難需要補充一下相應的知識。

下面介紹用於描述一個總體分布情況的特徵統計量,這里說的很正是,但是理解上應該不難。

這些式子其實不難就是,可能大家看了難於理解部分在對密度函數就積分來表示均值和方差,我們通常樣本是離散的,通過對樣本求和除以樣本數就可以近似得到總體均值,也就是總體數學期望,所謂期望就是均值。

還有自協方差,因為時間序列是隨機變數組,所以這里自表示對來源同一個隨機變數組兩個隨機變數間的協方差。

這里 就是 s 時刻隨機變數的均值。

時間序列難點就是我們僅可以觀察到某一個隨機變數一個觀察值,例如股票在某一天值,我們只能得到一個觀察值,某地區年平均降雨量也只能得到一個觀察值,這樣同很難像以往我們通過大量樣本來估計總體的方式來解決時間序列問題。

對於一個數字,均值就是他自己,方差為 0 而且問題如何求一個數的協方差。這也就是時間序列難點所在。

為了解決時間序列,我們引入平穩的概念,通過一種假設或者說限制來降低時間序列研究難度,這就是為什麼我們要引入平穩概念到時間序列原因。

時間序列分析理論中有兩種平穩性定義

因為嚴平穩只是概念存在,實際研究價值不大,隨意我們主要研究就是寬平穩。有關寬平穩定義在之前分享已經提及了,這里就不再贅述了,重點回顧一下什麼是寬平穩以及他的特點,寬平穩定義不說了,大家覺得難應該是寬平穩的幾個特性,也就是如何定義寬平穩。

說明每一個隨機變數的均值都是一個常數

這表示在時間序列中兩個隨機變數的自協方差與跨度有關

這里我們想一想如何用一個隨機變數和其自己做協方差相關系數,

我們這里所說隨機性檢驗是建立在平穩序列基礎之上,只有滿足了平穩性

所謂平穩性時間序列,雖然每一 t 時刻隨機變數都是獨立,但是他們具有相似性,都服從相似的分布,所以才能夠研究時間序列。

這里我們想一想如何計算相鄰兩個隨機變數間自協方差,和其自己做協方差相關系數,原來對於 x 在 1 時刻只有一個觀測值,因為在不同時刻 X 分布近似,我們通過借用其他時刻的隨機變數觀測值來組成一個向量表示隨機樣本。借用其他時刻前提就是需要我們時間序列平穩,這也就是我們為什麼要研究平穩性的原因。

通過上面方法我們還可以得到另一個 2 時刻 X 隨機樣本。

因為是平穩序列,我們之前已經知道平穩序列的一個特點也就是跨度相同時間序列隨機變數間的自相關系數相同。在平穩時間序列中,時間距離比較近隨機變數間的自相關系數要大於距離較遠隨機變數間的相關系數。

上面我們說了通過假定為平穩的時間序列更加便於研究,那麼如何判斷一個時間序列是平穩的時間序列呢,這就是接下來我們要討論的內容。

我們這里所說隨機性檢驗是建立在平穩序列基礎之上,只有滿足了平穩性。如果是隨機就說明隨機變數間沒有信息的傳遞。如果序列是隨機,那麼隨機變數就沒有可以分析價值,但是並不是說我們就沒有辦法了,這里還有一本書隨機過程來處理隨機序列。這是一門研究生課程用於專門研究隨機過程。隨機時間序列也是可以看作白雜訊,接下來我們數學方式描述一下

從上面來看自相關系數為 0 表示沒有每一兩個隨機變數間都是沒有關系的,也就是信息向下傳遞。圖像處理,研究一些波或者信號處理都用到白雜訊。
檢驗白雜訊就是檢驗序列是否為平穩的,只有平穩時間序列才能算上平穩時間序列。

❽ 度量股票市場的波動性有哪些常見方法

1.首先你要知道股票的數據是時間序列數據。
經研究表明,股票數據是有自相關性的,所以古典的回歸模型擬合常常是無效的。

2.另外股票數據序列是具有平穩性,或一階差分、高階差分平穩性
所以一般來說都會採用平穩性時間序列模型。
簡單的如AR(p), MA(q), ARMA(p,q)模型等。

3.但由於這些數據往往還有條件異方差性。進一步的模型修正
有ARCH(p) , GARCH(p,q)等模型。

3中的模型是現今一些研究股票波動的主流手段的基礎。

4.如果要研究多支股票波動的聯合分布,可以用Copula理論進行建模(這個一般用於VaR,ES風險度量,比較前沿,國內90年代才開始引進,但並不算太難)

5.另外還有一些非實證的手段,那是搞數學的弄的了

❾ 時間序列基礎

1.隨機時序分析的基本概念
1)隨機變數:簡單的隨機現象,如某班一天學生出勤人數,是靜態的。
2)隨機過程:隨機現象的動態變化過程。動態的。如某一時期各個時刻的狀態。
所謂隨機過程,就是說現象的變化沒有確定形式,沒有必然的變化規律。用數學語言來說,就是事物變化的過程不能用一個(或幾個)時間t的確定的函數來描述。
如果對於每一特定的t屬於T(T是時間集合),X(t)是一個隨機變數,則稱這一族無窮多個隨機變數{X(t),t屬於T}是一個隨機過程。

2.白雜訊序列
1)純隨機過程:隨機變數X(t)(t=1,2,3……),如果是由一個不相關的隨機變數的序列構成的,即對於所有s不等於k,隨機變數Xs和Xk的協方差為零,則稱其為 純隨機過程
2)白雜訊過程:如果一個純隨機過程的期望和方差均為常數,則稱之為 白雜訊過程 。白雜訊過程的樣本實稱成為白雜訊序列,簡稱白雜訊。
3)高斯白雜訊序列:如果白雜訊具體是服從均值為0、方差為常數的正態分布,那就是 高斯白雜訊序列

3.平穩性序列
1)平穩性可以說是時間序列分析的基礎。平穩的通俗理解就是時間序列的一些行為不隨時間改變, 所謂平穩過程就是其統計特性不隨時間的平移而變化的過程。
2)即時間序列內含的規律和邏輯,要在被預測的未來時間段內能夠延續下去。這樣我們才能用歷史信息去預測未來信息,類似機器學習中的訓練集和測試集同分布。
3)如果時間序列的變化是沒有規律的、完全隨機的,那麼預測模型也就沒有用。
4)平穩性的數學表達:如果時間序列在某一常數附近波動且波動范圍有限,即有常數均值和常數方差,並且延遲k期的序列變數的自協方差和自相關系數是相等的或者說延遲k期的序列變數之間的影響程度是一樣的,則稱該序列為平穩序列。簡單說就是沒有明顯趨勢且波動范圍有限。

4.嚴平穩/強平穩
1)通俗來說,就是時間序列的聯合分布隨著時間變化嚴格保持不變。
2)數學表達:如果對所有的時刻 t, (yt1,yt2,…ytm)的聯合分布與(y(t1+k),(yt2+k),…y(tm+k))的聯合分布相同,我們稱時間序列 {yt} 是嚴平穩的。也就是時間序列的聯合分布在時間的平移變換下保持不變。

5.弱平穩
1)數學表達:均值不變,協方差Cov(yt,y(t-k))=γk,γk依賴於k。
2)即協方差也不隨時間改變,而僅與時間差k相關。
3)可以根據根據時間序列的折線圖等大致觀察數據的(弱)平穩性:*所有數據點在一個常數水平上下以相同幅度波動。
4)弱平穩的線性時間序列具有短期相關性(證明見參考書),即通常只有近期的序列值對現時值得影響比較明顯,間隔越遠的過去值對現時值得影響越小。至於這個間隔,也就是下面要提到的模型的階數。

6.嚴平穩和弱平穩的關系
1)嚴平穩是一個很強的條件,難以用經驗的方法驗證,所以一般將弱平穩性作為模型的假設條件。
2)兩者並不是嚴格的包含與被包含關系,但當時間序列是正態分布時,二者等價。

7.單位根非平穩序列(可轉換為平穩序列的非平穩序列)
在金融數據中,通常假定資產收益率序列是弱平穩的。但還有一些研究對象,比如利率、匯率、資產的價格序列,往往不是平穩的。對於資產的價格序列,其非平穩性往往由於價格沒有固定的水平,這樣的非平穩序列叫做單位根(unit-root)非平穩序列。
1)最著名的單位根非平穩序列的例子是隨機遊走(random walk)模型:
pt=μ+p(t-1)+εt
μ是常數項(漂移:drift)。εt是白雜訊序列,則pt就是一個隨機遊走。它的形式和AR模型很像,但不同之處在於,AR模型中,系數的模需要小於1,這是AR的平穩性條件,而隨機遊走相當於系數為1的AR公式,不滿足AR模型的平穩性條件。
隨機遊走模型可作為(對數)股價運動的統計模型,在這樣的模型下,股價是不可預測的。因為εt關於常數對稱,所以在已知p(t-1)的條件下,pt上升或下降的概率都是50%,無從預測。
2)帶趨勢項的時間序列
pt=β0+β1*t+yt,yt是一個平穩時間序列。
帶漂移的隨機遊走模型,其均值和方差都隨時間變化;而帶趨勢項的時間序列,其均值隨時間變化,但方差則是不變的常數。
單位根非平穩序列可以進行平穩化處理轉換為平穩序列。比如用差分法處理隨機遊走序列,用用簡單的回歸分析移除時間趨勢處理帶趨勢項的時間序列。

建立具體的模型,需解決如下三個問題模型的具體形式、時序變數的滯後期以及隨機擾動項的結構。

μ是yt的均值;ψ是系數,決定了時間序列的線性動態結構,也被稱為權重,其中ψ0=1;{εt}為高斯白雜訊序列,它表示時間序列{yt}在t時刻出現了新的信息,所以εt稱為時刻t的innovation(新信息)或shock(擾動)。
線性時間序列模型,就是描述線性時間序列的權重ψ的計量經濟模型或統計模型,比如ARIMA。因為並非所有金融數據都是線性的,所以不是所有金融數據都適合ARIMA等模型。

①自回歸模型(AR)
用變數自身的歷史時間數據對變數進行回歸,從而預測變數未來的時間數據。
p階(滯後值,可暫理解為每個移動窗口有p期)自回歸公式即AR(p):

②移動平均模型(MA)
移動平均模型關注的是誤差項的累加,能夠有效消除預測中的隨機波動。
可以看作是白雜訊序列的簡單推廣,是白雜訊序列的有限線性組合。也可以看作是參數受到限制的無窮階AR模型。

③自回歸移動平均模型(ARMA)
有時候,要用很多階數的AR和MA模型(見後面的定階問題),為解決這個問題提出ARMA模型。
對於金融中的收益率序列,直接使用ARMA模型的時候較少,但其概念與波動率建模很相關,GARCH模型可以認為是對{εt}的ARMA模型。

④自回歸差分移動平均模型(ARIMA)
ARIMA比ARMA僅多了個"I",代表的含義可理解為 差分。
一些非平穩序列經過d次差分後,可以轉化為平穩時間序列。我們對差分1次後的序列進行平穩性檢驗,若果是非平穩的,則繼續差分。直到d次後檢驗為平穩序列。

⑤一般分析過程
1、 平穩性檢驗
ADF檢驗(單位根檢驗):這是一種檢查數據穩定性的統計測試。
原假設(無效假設):時間序列是不穩定的。
2、 平穩化處理
平穩化的基本思路是:通過建模並估計趨勢和季節性這些因素,並從時間序列中移除,來獲得一個穩定的時間序列,然後再使用統計預測技術來處理時間序列,最後將預測得到的數據,通過加入趨勢和季節性等約束,來還原到原始時間序列數據。
2.0 對數變換
對某些時間序列需要取對數處理,一是可以將一些指數增長的時間序列變成線性增長,二是可以穩定序列的波動性。對數變換在經濟金融類時間序列中常用。
2.1 差分法
如果是單位根非平穩的(比如隨機遊走模型),可以對其進行差分化。它能讓數據呈現一種更加平穩的趨勢。差分階數的選擇通常越小越好,只要能夠使得序列穩定就行。
2.2 平滑法
移動平均、指數加權移動平均
註:經差分或平滑後的數據可能因包含缺失值而不能使用檢驗,需要將缺失值去除
2.3 分解法
建立有關趨勢和季節性的模型,並從模型中刪除它們。
3 、建立模型:模型選擇和模型的定階
模型的選擇即在AR、MA、ARMA、ARIMA中間如何選擇。
模型的定階即指定上面過程中產生的超參數p、q和d(差分的階數)。
(1)用ACF和PACF圖判斷使用哪種線性時間序列模型
AR模型:ACF拖尾,PACF截尾,看PACF定階。
MA模型:ACF截尾,PACF拖尾,看ACF定階。
ARMA模型:都拖尾。(EACF定階)
截尾:在某階後 迅速 趨於0(後面大部分階的對應值在二倍標准差以內);
拖尾:按指數衰減或震盪,值到後面還有增大的情況。
ARIMA模型:適用於差分後平穩的序列。
(2)利用 信息准則 函數選擇合適的階
對於個數不多的時序數據,可以通過觀察自相關圖和偏相關圖來進行模型識別,倘若要分析的時序數據量較多,例如要預測每隻股票的走勢,就不可能逐個去調參了。這時可以依據AIC或BIC准則識別模型的p, q值,通常認為AIC或BIC值越小的模型相對更優。
AIC或BIC准則綜合考慮了殘差大小和自變數的個數,殘差越小AIC或BIC值越小,自變數個數越多AIC或BIC值越大。AIC或BIC准則可以說是對模型過擬合設定了一個標准。
AIC (Akaike information criterion,赤池信息度量准則)
AIC=2k-2ln(L)
· BIC (Bayesian information criterion,貝葉斯信息度量准則)
BIC=kln(n)-2ln(L)
k為模型的超參數個數,n為樣本數量,L為似然函數。
類比機器學習中的損失函數=經驗損失函數+正則化項。
模型選擇標准:AIC和BIC越小越好(在保證精度的情況下模型越簡單越好)
4 、模型檢驗和評估(之前應切分訓練集和驗證集)
檢驗殘差是否符合標准(QQ圖):是否服從均值為0,方差是常數的正態分布(εt是否是高斯白雜訊序列)。
擬合優度檢驗(模型的評估):R 2和調整後的R 2(R^2隻適用於平穩序列)。
5 、預測
如果之前進行了標准化、差分化等,需要進行還原:
標准化的還原要注意是log(x+1)還是log(x)。

1 、基礎概念
波動率
在期權交易中,波動率是標的資產的收益率的條件標准差。之前的平穩序列假設方差為常數,但當序列的方差不是常數時,我們需要用波動率對其變化進行描述。
對於金融時間序列,波動率往往具有以下特徵:
存在波動率聚集(volatility cluster)現象。 即波動率在一些 時間段 上高,一些時間段上低。
波動率以連續時間變化,很少發生跳躍。
波動率不會發散到無窮,而是在固定的范圍內變化(統計學角度上說,其是平穩的)
杠桿效應:波動率對價格大幅上升和大幅下降的反應是不同的。
波動率模型/條件異方差模型
給資產收益率的波動率進行建模的模型叫做條件異方差模型。這些波動率模型試圖刻畫的數據有這樣的特性: 它們是序列不相關或低階序列相關的(比如股票的日收益率可能相關,但月收益率則無關),但又不是獨立的 。波動率模型就是試圖刻畫序列的這種非獨立性。
定義信息集F(t-1)是包含過去收益率的一切線性函數,假定F(t-1)給定,那麼在此條件下時間序列yt的條件均值和條件方差分別表示為:

❿ 如何用判斷時間序列是否平穩呢

首先繪制時序圖,觀察是否存在波動和向上或向下的趨勢
然後做相關系數圖,若隨k增大,自相關系數迅速衰減則序列平穩;若隨k增大,自相關系數衰減緩慢則序列不平穩
最後進行單位根檢驗,P-值<α時,拒絕存在單位根的原假設,序列平穩。