본문 바로가기
반응형

프로그래밍 ( Programming )/머신러닝 ( ML )13

Markov Process (마코프 체인, 마코프 프로세스) Markov Property 마코프 특성이란 과거 상태들과 현재 상태가 주어졌을 때 미래 상태는 과거와는 독립적이며 현재 상태에 의해 결정되는 개념입니다. 즉, 현재 상태에서 다음 상태로 전이될 확률은 오직 현재 상태에서만 의존하며 이전 상태나 이전 이벤트의 영향을 전혀 받지 않는 특성입니다. 이처럼 마코프 프로세스는 과거 상태를 반영 또는 기억하지 않기 때문에 Memoryless 프로세스입니다. t-k 시점부터 t까지 여러 state를 거쳐오면서 다음 시점인 t+1에 가기 위한 확률은 바로 직전 state인 t시간의 state 확률과 같다는 것을 의미합니다. Markov Process 마코프 과정은 이러한 마코프 특성 (Markov Property)를 지니는 이산 시간 확률 과정을 의미합니다. 이산 시.. 2023. 4. 23.
Acceptance-Rejection Sampling (허용-기각 샘플링) Acceptance-Rejection Sampling Inverse Transform Method와 마찬가지로 확률분포에서 샘플링을 하기 위한 기법 중 하나이며 제안 분포 (Proposal Distribution)를 이용하여 생성된 샘플들의 분포가 목표 분포 (Target Distribution)를 따르도록 수정하는 과정을 포함한 샘플링입니다. 목표 분포의 특징은 직접 샘플을 생성하는 게 어렵거나 불가능하다는 특징이 있습니다. Acceptance-Rejection Sampling을 적용하여 목표 분포에 대해서 샘플링을 하기 위해서는 우선 확률 밀도 함수 (PDF)를 알고 있어야 합니다. Motivation Inverse Transform Method와 같이 CDF가 역함수가 가능한 상황에서 적용할 수 있.. 2023. 4. 22.
Inverse Transform Sampling (역 변환 샘플링) Inverse Transform Sampling Uniform distribution에서 내가 알고 싶은 분포를 무작위 추출 (Random Sampling)이 가능하도록 바꿔주는 방법입니다. 우선 샘플링의 의미는 어떤 특정 분포를 따르는 무작위 샘플을 생성하는 것을 의미하며, 모집단에서 표본을 추출하는 일입니다. 우리에게 익숙한 개념들이 있습니다. PDF (확률밀도함수)는 각 입력값 x에 따른 확률 밀도를 알려주는 함수입니다. CDF (누적밀도함수)의 단점은 어떤 값이 더 자주 나오는지 모르지만 PDF는 CDF를 미분하여서 각 구간 변화의 정도를 얻을 수 있으며 해당 값들의 연속이 결국 어떤 값의 정도를 확인할 수 있습니다. 그러나 PDF 또는 CDF를 통해서는 샘플링이 불가능합니다. 두 함수가 확률 분.. 2023. 4. 21.
Random Number Generator (난수 발생기) 난수 발생기 (Random Number Generator, RNG) 랜덤으로 보이는 일련의 sequence를 만드는 과정을 의미합니다. 우리가 컴퓨터 상에서 사용하는 랜덤이라는 수는 사실 컴퓨터가 랜덤 하게 생성한 게 아닌 어떤 일련의 규칙을 통해서 우리가 인식하기에 랜덤이라고 보일 뿐입니다. TRNG (True Random Number) vs PRNG (Pseudo Random Number) TRNG는 물리적인 요소를 통해서 랜덤 수를 생성합니다. 예를 들어서 방사성 붕괴 (Radioactive decay), 열적 노이즈 (Thermal Noise), 그리고 대기 노이즈와 같이 이러한 요소들은 상당히 불확실성 한 특징을 지니고 있기에 이러한 특징을 이용하여 난수를 생성합니다. PRNG는 determin.. 2023. 4. 21.
Frequentist vs Bayesian (빈도주의자 vs 베이지안) 두 개의 개념은 확률을 해석하는 관점의 차이에 있습니다. Frequentist 확률은 장기적으로 일어나는 사건의 빈도로 주장합니다. 그리고 모수는 고정된 상수라고 가정하고 해석합니다. 장점 Objective Probability Statements: 빈도주의에서의 통계 접근은 긴 시간 동안의 event관찰을 통해서 객관적인 확률 statements를 제공할 수 있습니다. 즉, 결과 해석에 대해서 좀 더 빠르고 비 주관적으로 해석할 수 있습니다. 이는 곧 Robustness와 직결됩니다. Widely used: 베이지안 접근 보다 훨씬 다양한 상황에서 사용이 되며 대부분의 경우 샘플 수가 많기 때문에 더 많은 상황에서 사용이 가능하며 충분히 납득할만한 결과를 기대할 수 있습니다. 단점 Limited fle.. 2023. 4. 21.
몬테 카를로 (Monte Carlo) 몬테카를로 메서드 또는 다중 확률 시뮬레이션이라고도 하는 몬테카를로 시뮬레이션은 불확실한 사건의 가능한 결과를 추정하는 데 사용되는 수학적 기법입니다. 예를 들어서 집에서 회사를 갈 때 단순하게 고려하면 거리에 따라서 얼마나 시간이 걸릴지를 고려하여서 상당히 결정적입니다. 그러나 실제 상황에서는 교통 혼잡, 악천후 및 차량 고장등 확률적으로 낮은 상황들이 발생할 수 있기에 불확실성을 고려한 이동시간을 예측할 수 있습니다. 핵심은 반복적인 무작위적 샘플링입니다 (이러한 특징때문에 카지노와 도박장이 유명한 몬테카를로 지역이름을 채택하기도 하였습니다) 문제를 해결하기 위해서 반복적인 랜덤 샘플링을 통해서 문제를 풀게 되며, 기존에 우리가 생각하던 문제 해결 방식인 절차에 따라서 기계적으로 해결하는 방식과는 다.. 2023. 4. 20.
[ML] Bayesian Optimization이란 Introduction (도입) 보통 우리가 실험을 하거나 입력을 넣고 결과가 나오는 현상에 대해서 이해를 하기 위해서 입력과 결과 사이의 관계를 파악하고 그리고 관계를 이용하여 공식을 도출하고 싶어 합니다. 너무나도 잘 알려진 공식 F=ma 또한 그렇게 나온 것이니... 이때 입력과 결과 사이에 관계를 표현하는 요소를 보통 Black Box 또는 Black box function이라고 표현합니다. 그리고 Black Box의 특징은 다음과 같습니다. closed form으로 표현되지 않으며 Non-Linear 또는 Non-Convex 하여 수렴이 잘 되지 않는다. 또한 상당히 Complex, Noisy 하다. 마지막으로 데이터를 한번 얻기 위해 또는 evaluate를 하기 위해서 수많은 비용과 시간이 드.. 2021. 12. 10.
[ML] Logistic Regression 설명 및 직접 구현해보기 Logistic Regression (로지스틱 회귀) 로지스틱 회귀 이전에 존재하던 퍼셉트론은 간단하고 좋은 모델이지만 가장 큰 단점은 클래스가 선형적으로 구분되지 않을 때 수렴이 불가능하다는 점입니다. 에포크마다 적어도 하나의 샘플이 잘못 분류되기 때문에 가중치 업데이트가 끝도 없이 계속될수가 있습니다. 물론 학습률을 바꾸거나 에포크 횟수를 늘릴 수는 있지만 한계는 분명 명확하게 존재합니다. 로지스틱 회귀는 이름은 회귀 (Regression)이지만 실제로는 분류 (Classification) 모델입니다. 로지스틱 회귀는 구현이 매우 쉽고 선형적으로 구분되는 클래스에 뛰어난 성능을 내는 분류 모델입니다. 산업계에서 가장 널리 사용되는 분류 알고리즘 중 하나로써 어떤 범주에 속할 확률을 0~1 사이의 값으.. 2021. 12. 2.
[ML] Cross validation(교차 검증)의 개념, 의미 머신러닝을 수행하기 위해서 목표로 하고자 하는 영역에서 주어진 데이터에 어떠한 경향이 있는지를 파악하도록 하는 학습과정이 필요로 합니다. Data를 통해서 좋은 네트워크를 만들수 있으며 그리고 데이터를 이용하여 좋은 네트워크인지를 판단할 수가 있습니다. Cross validation에 대해서 적어보기 이전에 우선 머신러닝에서 다루는 data의 개념들을 먼저 살펴보겠습니다. 주어진 data가 있을때 우리는 주어진 데이터를 이용하여 목적에 맞는 모델을 만들어야 합니다. 모델을 만들기 위해서는 위에서 언급드렸다시피 학습과정이 필요한데, 주어진 data를 학습 데이터 (Training Set)로 활용할 수 있습니다. 하단과 같이 data 전체를 학습 데이터로 활용이 가능합니다. 그러나 문제점은 머신러닝 모델은 .. 2021. 11. 22.
반응형