분위수 회귀분석
분위수 quantile에 따라 분석한다.
만약 분위수가 25라면 실제값 y가 예측값 p보다 작을 확률이 25%라는거임
L(yip, yi) = max[q(yip − yi), (q − 1)(yip − yi)]
즉 q가 0.5라면 median absoultue error를 측정한다.
This is equivalent to saying that the mean absolute error loss function has its minimum at the median.
median값일때 MAE값이 최소다.
퀀타일값이 0.5일때는 median을 추정한다.
모델중에 앙상블모델이있는데
크게 베깅하고 부스팅이있음
베깅이 랜덤포레스트고
부스팅으로 gbm 만든다
gbm의 발전된 형태가 lgbm xgboost등등이 있음
부스트 트랩
bkshin.tistory.com/entry/DATA-12?category=1042793
앙상블
베깅
부트트랩은 그냥 랜덤으로 뽑는거임
feature백개있으면 그거 한방에 decision tree만들면 오버피팅나니까 모집단으로 뽑아서 voting하는 방식이 베깅
부스팅
얘는 점점 업글하면서 나아간다.
부스트 모델의 가장 기본이 AdaBoost랑 GBM있다.
하나씩보자
AdaBoost
bkshin.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-14-AdaBoost
걍 알아서 찾아보셈 ㅋ
일사량 종류
1. 전천 일사량 : 가장 많이 사용하는 일사량, 수평면 일사량
전천일사량 = 직달일사량 x cos천정각(90-태양고도)+산란 일사량
2.
'study > dacon' 카테고리의 다른 글
cnn 신경망 커널 시각화 (0) | 2021.05.04 |
---|