7.7 Resampling Methods
·
통계
* 본 블로그 포스트에서 사용된 표, 이미지 및 기타 관련 자료는 "PROBABILITY AND STATISTICAL INFERENCE 9th Edition"에서 발췌한 것입니다. 이 자료들은 내용을 요약하고 이해를 돕기 위한 참고용으로 제공됩니다. 또한, 해석 과정에서 일부 오류가 있을 수 있으니 원본을 참고하여 확인하시기 바랍니다 1. 이론 정리 1) 재표본추출 방법 (Resampling Methods)     (1) 개요         a) 재표본추출(resampling)은 컴퓨터 계산 능력이 향상됨에 따라 더욱 중요한 방법론이 됨.         b) 표본통계량이 확률분포를 가진다는 개념을 학생들에게 설명하는 데 유용하게 활용됨.         c) 특정 통계량의 근사적인 분포를 추정하는 데 사용..
Chapter 2. 지도학습(Supervised learning): 랜덤포레스트(Random Forest)
·
데이터분석
참고 문헌:1. 서강대 AI MBA 데이터마이닝 강의교재 (2023)2. Müller, A. C., & Guido, S. (2016). *Introduction to Machine Learning with Python*. 1st Edition. O’Reilly Media, Inc., Sebastopol, CA. ISBN: 978-1449369415. 랜덤 포레스트(Random Forest)는 여러 개의 결정 트리(Decision Tree)를 모아서 더 좋은 모델을 만드는 앙상블 기법이다. 결정 트리 하나만으로는 과적합(overfitting) 문제가 생기기 쉬운데, 랜덤 포레스트는 그 문제를 해결할 수 있다. 여러 트리를 사용해서 데이터를 학습하고 예측함으로써, 과적합을 방지하면서 성능을 높일 수 있는 방..
VirtualJin
'부트스트랩' 태그의 글 목록