본문 바로가기

study/dacon

dacon 태양광

분위수 회귀분석

분위수 quantile에 따라 분석한다.

만약 분위수가 25라면 실제값 y가 예측값 p보다 작을 확률이 25%라는거임

 

L(yip, yi) = max[q(yip − yi),  (q − 1)(yip − yi)]

 

즉 q가 0.5라면 median absoultue error를 측정한다.

 

This is equivalent to saying that the mean absolute error loss function has its minimum at the median.

median값일때 MAE값이 최소다.

 

퀀타일값이 0.5일때는 median을 추정한다.

 

 

 

 

모델중에 앙상블모델이있는데

크게 베깅하고 부스팅이있음

베깅이 랜덤포레스트고

부스팅으로 gbm 만든다

gbm의 발전된 형태가 lgbm xgboost등등이 있음

 

 

 

부스트 트랩

bkshin.tistory.com/entry/DATA-12?category=1042793

앙상블 

bkshin.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-11-%EC%95%99%EC%83%81%EB%B8%94-%ED%95%99%EC%8A%B5-Ensemble-Learning-%EB%B0%B0%EA%B9%85Bagging%EA%B3%BC-%EB%B6%80%EC%8A%A4%ED%8C%85Boosting

 

머신러닝 - 11. 앙상블 학습 (Ensemble Learning): 배깅(Bagging)과 부스팅(Boosting)

앙상블(Ensemble) 앙상블은 조화 또는 통일을 의미합니다. 어떤 데이터의 값을 예측한다고 할 때, 하나의 모델을 활용합니다. 하지만 여러 개의 모델을 조화롭게 학습시켜 그 모델들의 예측 결과들

bkshin.tistory.com

 

베깅

부트트랩은 그냥 랜덤으로 뽑는거임

feature백개있으면 그거 한방에 decision tree만들면 오버피팅나니까 모집단으로 뽑아서 voting하는 방식이 베깅

 

부스팅

얘는 점점 업글하면서 나아간다. 

 

부스트 모델의 가장 기본이 AdaBoost랑 GBM있다.

 

하나씩보자

AdaBoost 

bkshin.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-14-AdaBoost

 

걍 알아서 찾아보셈 ㅋ

 

 

 

 

 

일사량 종류

1. 전천 일사량 : 가장 많이 사용하는 일사량, 수평면 일사량

 

전천일사량 = 직달일사량 x cos천정각(90-태양고도)+산란 일사량

 

 

2.  

 

 

 

 

 

 

 

'study > dacon' 카테고리의 다른 글

cnn 신경망 커널 시각화  (0) 2021.05.04