모바일 앱 환경에서는 latex 수식이 깨져 나타나므로 가급적 웹 환경에서 봐주시길 바랍니다.
오늘은 수리통계학적인 개념들에 대해 복습하고자 한다.
이는 앞으로 다양한 Random process에 대해 다뤄보는 데 있어 기본적인 밑바탕이 될 것이다.
수리통계학을 충분히 학습한 사람은 이 내용이 크게 어렵지 않으리라 생각한다.
먼저 확률수렴에 대한 정의이다.
Random variable sequence $\{X_n\}$이 모든 $\epsilon > 0$에 대해 다음과 같으면 $X$에 'converge in probability'라 한다.
$\lim_{n \rightarrow \infty} \mathbb{P}[|X_n - X| \ge \epsilon] = 0$
다음은 'weak version' 의 Law of large number이다.
Random variable sequence $\{X_n\}$이 i.i.d일 때 평균을 $\mu$, 분산을 $\sigma^2$이라 하자.
그리고 $\bar{X}_n := \frac{1}{n} \sum_{i=1}^n X_i$라 할때,
$\bar{X}_n \rightarrow \mu$
가 성립한다.
이는 체비셰프 부등식을 활용하여 쉽게 증명할 수 있다.
또한 이와 같은 확률 수렴은 선형성을 갖는다. (closed under the linearity)
다음은 분포수렴이다.
Random variable sequence $\{X_n\}$이 있고 $X$가 있다. 이때 $X_n$과 $X$의 cdf를 각각 $F_{X_n}$, $F_X$라 하자.
$F_X$가 연속인 모든 점의 집합을 $C(F_X)$라 할 때, 다음을 만족하면 $X_n$은 $X$에 분포수렴 (converge in distribution)이라 한다.
$\lim_{n \rightarrow \infty} F_{X_n}(x) = F_X(x)$
분포수렴은 확률수렴보다 약한데 다음과 같은 정리가 성립한다.
* $X_n$이 $X$로 확률수렴하면, $X_n$은 $X$로 분포수렴한다. 하지만 그 역은 성립하지 않는다.
이제 Random process의 가장 기본적인 예제에 해당하는 모델 'Bernoulli process'를 살펴보자.
Bernoulli process는 'binary' Random variable sequence ($\{ X_t \}$)로 정의되며 이 때 set index $t \in T$는
discrete-time이다.
각 time step $t$에서의 Random variable $X_t$는 0 또는 1의 값을 가질 수 있으며, i.i.d이다.
예를 들어서 Bernoulli distribution의 parameter $p$가 알려져 있다고 해보자.
어찌되었든 현재 time step $X_t$의 값을 알기 위해 이전 time step의 정보들은 무의미하다.
즉, 과거에 얼마나 성공했는지가 현재의 성공여부에 대해서는 아무런 정보를 제공해주지 못한다.
하지만, 만약 $p$가 알려져 있지 않다라면, 모르는 상태라면, 과거 시행들을 바탕으로 $p$의 값을 유추해볼 수 있고,
이는 현재 $X_t$의 값을 예측하는데 영향을 미친다.
직관적으로 이해하긴 어렵지 않다. 이를 좀 더 엄밀하게 표현해보자.
** measure theory, Topology 등에 대해 친숙하다는 가정하에 서술한다.
Sequence space $\Omega$는 다음과 같이 정의될 것이다. $\Omega = \{0, 1\}^{\mathbb{N}}$.
이 집합의 임의의 원소 $w \in \Omega$는 0과 1로 이루어진 (finitely many or infinite) sequence이다.
이 공간의 Borel $\sigma$-algebra, $\mathcal{B}(\Omega)$는 'product topology'들에 의해 생성된 $\sigma$-algebra이다.
그리고 이러한 measurable space를 우리는 $(\Omega, \mathcal{B})$로 표기할 수 있다.
measurable space를 measure space로 만들기 위해서는 마지막으로 measure를 정의할 필요가 있는데
이를 Bernoulli measure라 한다.
$X=1$일 확률을 $p$, 그 반대 확률을 $q$라 하자.
그럼 당연히 $p + q = 1$이다.
Bernoulli measure는 Borel $\sigma$-algebra, $\mathcal{B}$의 임의의 원소 (즉, cylinder set) 에 대해 확률을 부여해주는 measure이다.
즉, 어떤 특정한 sequence가 발생할 확률을 정의해준다.
예를 들어 $\mathbb{P}([w_1, w_2, \cdots, w_n])$이 $X=1$을 k개, $X=0$을 $n-k$개 가지고 있는 특정한 outcome이라면
이에 대한 확률은 $p^k (1 - p)^{n-k}$ 일 것이다.
따라서, Bernoulli process는 다음과 같은 probability space에서 정의되는 Random variable의 sequence이다.
$(\Omega, \mathcal{B}, \mathbb{P})$
'Deep dive into Optimization' 카테고리의 다른 글
Gradient descent 1. (심화) (0) | 2024.04.02 |
---|---|
Optimization 심화 : Random process (4, Stochastic process) (1) | 2023.12.31 |
Optimization 심화 : Random process 2 (Stochatic process) (2) | 2023.12.13 |
Optimization 심화 : Random process 1(Stochastic process) (2) | 2023.12.06 |
Optimization 심화 : Noise에 대하여 (1) (1) | 2023.11.21 |
댓글