자청의 유튜브 추출기

유튜브 영상의 자막과 AI요약을 추출해보세요

AI 채팅

BETA

Markov Chains Clearly Explained! Part - 1

게시일: 작성자: 자청의 유튜브 추출기

마르코프 연쇄, 쉽게 이해하기!

이 영상은 마르코프 연쇄라는 개념에 대해 설명해주는 영상이야. 통계, 생물학, 경제학, 물리학, 그리고 머신러닝까지 정말 다양한 분야에서 쓰이는 중요한 개념이지.

마르코프 연쇄란?

간단하게 말하면, 미래가 오직 현재에만 달려있는 시스템을 말해. 과거의 모든 것을 기억할 필요 없이, 지금 이 순간만 알면 다음 순간을 예측할 수 있다는 거지.

예시:

어떤 식당이 햄버거, 피자, 핫도그 세 가지 메뉴만 판다고 상상해봐. 그런데 이 식당은 좀 특이한 규칙이 있어.

  • 오늘 햄버거를 팔았으면, 내일은 60% 확률로 피자를 팔아.
  • 오늘 햄버거를 팔았으면, 내일은 20% 확률로 또 햄버거를 팔아.

이런 식으로 각 메뉴를 팔았을 때, 다음 날 어떤 메뉴를 팔 확률이 얼마나 되는지를 화살표로 나타낼 수 있어. 이 화살표를 전이(transition)라고 부르고, 각 메뉴는 상태(state)라고 불러. 이렇게 상태와 전이를 연결한 그림이 바로 마르코프 연쇄야!

마르코프 연쇄의 중요한 특징

  1. 미래는 오직 현재에만 달려있다 (마르코프 속성):

    • 내일 뭘 팔지는 오늘 뭘 팔았는지에만 달려있지, 어제 뭘 팔았는지, 그저께 뭘 팔았는지 등 과거의 모든 기록은 중요하지 않아.
    • 예를 들어, 오늘 피자를 팔았다면, 내일 핫도그를 팔 확률은 70%야. 이게 어제 뭘 팔았든 상관없이 똑같다는 거지.
  2. 나가는 화살표들의 확률 합은 항상 1:

    • 어떤 상태에서 나가는 모든 화살표들의 확률을 다 더하면 항상 1이 돼야 해. 왜냐하면 확률은 0에서 1 사이의 값을 가지는데, 모든 가능한 경우의 수를 다 더하면 100%가 되어야 하니까.

마르코프 연쇄를 이용한 예측

1. 무작위 보행 (Random Walk):

마르코프 연쇄를 따라 무작위로 움직여보는 거야. 예를 들어, 처음에는 햄버거를 먹었다고 가정하고, 10일 동안 어떤 메뉴를 먹게 될지 시뮬레이션 해보는 거지.

  • 10일 동안 햄버거 4번, 피자 2번, 핫도그 4번을 먹었다면, 각 메뉴를 먹을 확률은 4/10, 2/10, 4/10이 되는 거야.

2. 정상 상태 (Stationary Distribution / Equilibrium State):

만약 아주아주 오랫동안 (예를 들어 10만 번) 무작위 보행을 하면, 각 메뉴를 먹을 확률이 특정 값으로 수렴하게 돼. 이걸 정상 상태라고 불러. 이 상태에서는 시간이 지나도 각 메뉴를 먹을 확률이 변하지 않아.

3. 선형대수학을 이용한 더 똑똑한 방법:

이런 정상 상태를 더 효율적으로 찾기 위해 선형대수학을 사용할 수 있어.

  • 전이 행렬 (Transition Matrix): 마르코프 연쇄를 숫자로 표현한 행렬이야. 각 행은 현재 상태를, 각 열은 다음 상태를 나타내고, 그 안의 숫자는 전이 확률이지.
  • 고유 벡터 (Eigenvector): 전이 행렬에 어떤 벡터를 곱해도 방향은 그대로 유지되고 크기만 변하는 벡터를 말해. 마르코프 연쇄에서는 고유값(eigenvalue)이 1인 고유 벡터가 바로 정상 상태를 나타내.
  • 파이 (π) 벡터: 각 상태의 확률을 담고 있는 행 벡터야. 이 파이 벡터에 전이 행렬을 계속 곱해주면, 결국 정상 상태의 파이 벡터에 수렴하게 돼. 즉, π * A = π (A는 전이 행렬) 라는 식을 만족하는 파이 벡터를 찾는 거지.

이 방법을 사용하면, 각 메뉴를 먹을 확률이 햄버거 35%, 피자 21%, 핫도그 46%라는 것을 알 수 있어.

왜 마르코프 연쇄가 중요할까?

마르코프 연쇄는 과거의 복잡한 정보 없이 현재 상태만으로 미래를 예측할 수 있다는 점에서 매우 강력해. 그래서 날씨 예측, 주가 예측, 언어 모델 등 다양한 분야에서 활용되고 있어.

이 영상은 마르코프 연쇄의 기본적인 개념을 설명해주고 있고, 더 깊이 있는 내용도 많으니 관심 있다면 더 찾아보는 것을 추천해!

최근 검색 기록