728x90
기준모델, 단순선형회귀
기준모델(Baseline Model)
- 검증 대상모델이 쓸만한 모델인지 판별하는 최소의 기준.
- 예를들어 5지선다 객관식 20문제에서 모두 3번으로 찍으면 기본적으로 4개는 맞출수 있다. 이것은 성능 20%의 기준모델이다. 이것보다 더 많이 맞추도록 머신러닝을 활용하는 것.
- 풀고자 하는 문제에 따라 유연하게 사용한다.
- 회귀 문제에는 보통 평균을 사용.
- 분류 문제에는 보통 최빈값을 사용.
- 시계열 회귀문제에서는 이전 타임스탬프 값을 사용
Simple Linear Regression (단순 선형 회귀)
- 타겟데이터와 특성데이터로 나누어준다.
- 특성행렬은 주로 X로 표현한다.
- 타겟 배열은 주로 y로 표현한다.
- fit() 메소드를 사용하여 모델을 학습한다.
- 'predict()' 메소드를 사용하여 새로운 데이터를 예측한다.
- 선형회귀는 주어져 있지 않은 점의 함수값을 보간(interpolate) 하여 예측하는데 도움을 준다.
- 선형회귀모델은 기존 데이터의 범위를 넘어서는 값을 예측하기 위한 외삽(extrapolate)도 제공한다.
- 종속변수는 반응(Response)변수, 레이블(Label), 타겟(Target)등으로 불립니다.
- 독립변수는 예측(Predictor)변수, 설명(Explanatory), 특성(feature) 등으로 불립니다.
300x250