Processing math: 100%
본문 바로가기
  • Deep dive into Learning
  • Deep dive into Optimization
  • Deep dive into Deep Learning
Deep dive into Optimization

Optimization 심화 : Random process (3, Stochastic process)

by Sapiens_Nam 2023. 12. 23.

 

모바일 앱 환경에서는 latex 수식이 깨져 나타나므로 가급적 웹 환경에서 봐주시길 바랍니다.

 

오늘은 수리통계학적인 개념들에 대해 복습하고자 한다.

이는 앞으로 다양한 Random process에 대해 다뤄보는 데 있어 기본적인 밑바탕이 될 것이다.

 

수리통계학을 충분히 학습한 사람은 이 내용이 크게 어렵지 않으리라 생각한다.

 

먼저 확률수렴에 대한 정의이다.

 

Random variable sequence {Xn}이 모든 ϵ>0에 대해 다음과 같으면 X에 'converge in probability'라 한다.

 

limnP[|XnX|ϵ]=0

 

다음은 'weak version' 의 Law of large number이다.

 

Random variable sequence {Xn}이 i.i.d일 때 평균을 μ, 분산을 σ2이라 하자.

그리고 ˉXn:=1nni=1Xi라 할때,

ˉXnμ

가 성립한다.

 

이는 체비셰프 부등식을 활용하여 쉽게 증명할 수 있다.

또한 이와 같은 확률 수렴은 선형성을 갖는다. (closed under the linearity)

 

다음은 분포수렴이다. 

 

 Random variable sequence {Xn}이 있고 X가 있다. 이때 XnX의 cdf를 각각 FXn, FX라 하자.

FX가 연속인 모든 점의 집합을 C(FX)라 할 때, 다음을 만족하면 XnX에 분포수렴 (converge in distribution)이라 한다.

limnFXn(x)=FX(x)

 

분포수렴은 확률수렴보다 약한데 다음과 같은 정리가 성립한다.

 

* XnX로 확률수렴하면, XnX로 분포수렴한다. 하지만 그 역은 성립하지 않는다.

 

 

이제 Random process의 가장 기본적인 예제에 해당하는 모델 'Bernoulli process'를 살펴보자.

 

Bernoulli process는 'binary' Random variable sequence ({Xt})로 정의되며 이 때 set index tT는 

discrete-time이다. 

각 time step t에서의 Random variable Xt는 0 또는 1의 값을 가질 수 있으며, i.i.d이다.

예를 들어서 Bernoulli distribution의 parameter p가 알려져 있다고 해보자. 

어찌되었든 현재 time step Xt의 값을 알기 위해 이전 time step의 정보들은 무의미하다. 

즉, 과거에 얼마나 성공했는지가 현재의 성공여부에 대해서는 아무런 정보를 제공해주지 못한다.

 

하지만, 만약 p가 알려져 있지 않다라면, 모르는 상태라면, 과거 시행들을 바탕으로 p의 값을 유추해볼 수 있고,

이는 현재 Xt의 값을 예측하는데 영향을 미친다.

 

직관적으로 이해하긴 어렵지 않다. 이를 좀 더 엄밀하게 표현해보자.

** measure theory, Topology 등에 대해 친숙하다는 가정하에 서술한다.

 

Sequence space Ω는 다음과 같이 정의될 것이다. Ω={0,1}N.

이 집합의 임의의 원소 wΩ는 0과 1로 이루어진 (finitely many or infinite) sequence이다. 

이 공간의 Borel σ-algebra, B(Ω)는 'product topology'들에 의해 생성된 σ-algebra이다.

그리고 이러한 measurable space를 우리는 (Ω,B)로 표기할 수 있다.

measurable space를 measure space로 만들기 위해서는 마지막으로 measure를 정의할 필요가 있는데 

이를 Bernoulli measure라 한다.

 

X=1일 확률을 p, 그 반대 확률을 q라 하자.

그럼 당연히 p+q=1이다.

Bernoulli measure는 Borel σ-algebra, B의 임의의 원소 (즉, cylinder set) 에 대해 확률을 부여해주는 measure이다.

즉, 어떤 특정한 sequence가 발생할 확률을 정의해준다.

예를 들어 P([w1,w2,,wn])X=1을 k개, X=0nk개 가지고 있는 특정한 outcome이라면

이에 대한 확률은 pk(1p)nk 일 것이다.

 

따라서, Bernoulli process는 다음과 같은 probability space에서 정의되는 Random variable의 sequence이다.

(Ω,B,P)

728x90

댓글