Chapter 2. 지도학습(Supervised learning): SVM
·
데이터분석
참고 문헌:1. 서강대 AI MBA 데이터마이닝 강의교재 (2023)2. Müller, A. C., & Guido, S. (2016). *Introduction to Machine Learning with Python*. 1st Edition. O’Reilly Media, Inc., Sebastopol, CA. ISBN: 978-1449369415. SVM(Support Vector Machine)은 분류와 회귀 문제를 해결하는 지도 학습 알고리즘이다. 주로 이진 분류 문제에서 효과적이며, 고차원 공간에서 데이터를 선형적으로 분리하는 초평면을 사용한다. 데이터가 복잡하거나 선형적으로 분리되지 않을 경우 커널 트릭을 통해 고차원 공간으로 사상하여 초평면으로 분류가 가능하게 한다. 이를 통해 SVM은 다양한..
Chapter Appendix : 최대우도법(Maximum Likelihood Estimation)
·
데이터분석
참고 문헌:1. 서강대 AI MBA 데이터마이닝 강의교재 (2023)2. Müller, A. C., & Guido, S. (2016). *Introduction to Machine Learning with Python*. 1st Edition. O’Reilly Media, Inc., Sebastopol, CA. ISBN: 978-1449369415. 최대우도법 (Maximum Likelihood Estimation, MLE)최대우도법(Maximum Likelihood Estimation, MLE)은 통계학에서 매우 중요한 방법론으로, 주어진 데이터에 가장 잘 맞는 확률분포의 모수를 추정하는 방법이다. 이 방법은 데이터가 관측된 확률분포로부터 생성되었다고 가정하고, 그 데이터가 발생할 가능성을 최대화하는..
Chapter 2. 지도학습(Supervised learning): Linear Models
·
데이터분석
참고 문헌:1. 서강대 AI MBA 데이터마이닝 강의교재 (2023)2. Müller, A. C., & Guido, S. (2016). *Introduction to Machine Learning with Python*. 1st Edition. O’Reilly Media, Inc., Sebastopol, CA. ISBN: 978-1449369415. Linear Models Regression(ordinary least squares)범용적으로 사용되고 있는 모델일반식 : $\hat{y} = w[0] \times x[0] + b$에서 MSE가 최소인 w 와 b를 찾는다.결정계수란?- 결정계수(決定係數, Coefficient of Determination)란 통계학에서 회귀 분석의 설명력을 나타내는 지표로..
Chapter 2. 지도학습(Supervised learning): K- Nearest Neighbors
·
데이터분석
참고 문헌:1. 서강대 AI MBA 데이터마이닝 강의교재 (2023)2. Müller, A. C., & Guido, S. (2016). *Introduction to Machine Learning with Python*. 1st Edition. O’Reilly Media, Inc., Sebastopol, CA. ISBN: 978-1449369415. generalization, overfiting, underfiting- 학습데이터가 부족한 경우 underfiting이 발생하며, 학습데이터를 과도하게 학습하면 overfiting이 발생한다.- 두 경우 모두 새로운 데이터로 예측할 경우 정확도가 낮아지는 문제가 발생할 가능성이 매우 높다.Bias vs Variance지도학습- 정답이 있는 데이터를 기반으..
Chapter1. Instruction
·
데이터분석
참고 문헌: 1. 서강대 AI MBA 데이터마이닝 강의교재 (2023) 2. Müller, A. C., & Guido, S. (2016). *Introduction to Machine Learning with Python*. 1st Edition. O’Reilly Media, Inc., Sebastopol, CA. ISBN: 978-1449369415. 1. 머신러닝이란: 데이터 마이닝이나 기타 학습 알고리즘을 사용하여, 지식을 추출하고, 이를 경험기반으로 삼아 비슷한 상황의 미래 사건의 결과를 예측하는 분야 2. 머신러닝 모델을 만들기 전에 유념해야 할 사항들어떤 질문에 대답하려고 합니까? 수집된 데이터가 그 질문에 답할 수 있다고 생각하나요?머신 러닝 문제로 내 질문을 표현하는 가장 좋은 방법은 무엇..
VirtualJin
'분류 전체보기' 카테고리의 글 목록 (26 Page)