scikit-learn 5

[토이 데이터셋] Scikit-Learn 라이브러리의 Datasets 패키지

Scikit-Learn 라이브러리의 Datasets 패키지 일반적으로 모델의 학습에 사용할 데이터는 사용자가 직접 파일 형태로 다운을 받은 후에 코드상으로 불러와야 합니다. 하지만, Scikit-Learn 라이브러리에서는 함수의 형태로 몇개의 데이터를 손쉽게 가져올 수 있습니다. Scikit-Learn 라이브러리는 기계학습(Machine Learning, ML) 모델을 구현하는데 있어서 가장 많이 사용하는 라이브러리 중 하나이며, Scikit-Learn에서 제공하는 데이터에는 Toy Dataset과 Real World Dataset이 있습니다. Toy Dataset은 실제 모델을 학습하여 좋은 성능을 이끌어 내기에는 크기가 작은 데이터셋을 말합니다. 크기가 작기 때문에 일종의 장난감(Toy)처럼 다양한 ..

[평가 지표] Root Mean Square Error (RMSE)

Root Mean Square Error (RMSE) 설명 Root Mean Square Error (RMSE)는 회귀 모델 (Regression Model)이 잘 학습되었는지를 확인할 때 많이 사용되는 평가지표입니다. RMSE는 실제 정답 값과 예측 값의 차이를 제곱한 후 평균을 구하여 도출 가능한 평균 제곱 오차(Mean Squared Error, MSE)에 제곱근을 씌어 구할 수 있으며, 값이 작을수록 모델의 성능이 좋다는 것을 의미합니다. MSE와 전반적인 특징은 유사하지만 제곱근이 씌어져있기 때문에 실제 정답값과 같은 단위를 갖는 평가지표입니다. ※ MSE에 대한 설명은 아래 링크에서 확인할 수 있습니다. 2022.05.14 - [정리] - [평가 지표] Mean Squared Error (MS..

정리/평가지표 2022.06.02

[평가 지표] Mean Squared Error (MSE)

Mean Squared Error (MSE) 설명 Mean Square Error (MSE)는 회귀 모델 (Regression Model)이 잘 학습되었는지를 확인할 때 많이 사용되는 평가지표입니다. MSE는 실제 정답 값과 예측 값의 차이를 제곱한 후 평균을 구하여 도출할 수 있으며, 값이 작을수록 모델의 성능이 좋다는 것을 의미합니다. MSE의 수식은 아래와 같습니다. 수식에서 $Y_{i}$은 실제 정답 값을 의미하고, $\widehat{Y}_{i}$은 예측 값을 의미합니다. MSE의 장단점 - MSE의 장점 1. Mean Absolute Error(MAE)와 더불어 가장 직관적인 평가지표 중 하나 - MSE의 단점 1. 오차를 제곱하기 때문에 이상치에 민감하게 변화함 2. 오차를 제곱하기 때문에 회..

정리/평가지표 2022.05.14

[평가 지표] Mean Absolute Percentage Error (MAPE)

Mean Absolute Percentage Error (MAPE) 설명 Mean Absolute Percentage Error (MAPE)는 회귀 모델 (Regression Model)이 잘 학습되었는지를 확인할 때 많이 사용되는 평가지표입니다. Mean Absolute Error (MAE)와 비슷하지만 실제 정답 값을 나누어 도출한 확률 값이라는 점이 가장 큰 차이점 이라고 할 수 있습니다. MAPE는 MAE와 동일하게 값이 작을수록 모델의 성능이 좋다는 것을 의미합니다. ※ MAE에 대한 설명은 아래 링크에서 확인할 수 있습니다. 2022.05.11 - [정리] - [평가 지표] Mean Absolute Error (MAE) MAPE의 수식은 아래와 같습니다. 수식에서 $Y_{i}$은 실제 정답 값..

정리/평가지표 2022.05.12

[평가 지표] Mean Absolute Error (MAE)

Mean Absolute Error (MAE) 설명 Mean Absolute Error (MAE)는 회귀 모델 (Regression Model)이 잘 학습되었는지를 확인할 때 많이 사용되는 평가지표입니다. MAE는 실제 정답 값과 예측 값의 차이를 절댓값으로 변환한 뒤 평균을 구하여 도출할 수 있으며, 값이 작을수록 모델의 성능이 좋다는 것을 의미합니다. MAE의 수식은 아래와 같습니다. 수식에서 $Y_{i}$은 실제 정답 값을 의미하고, $\widehat{Y}_{i}$은 예측 값을 의미합니다. MAE의 장단점 - MAE의 장점 1. 실제 정답 값, 예측 값과 같은 단위를 가지는 평가지표이기 때문에 결과 해석이 용이함 2. 절대값을 취하기 때문에 직관적으로 결과를 해석할 수 있음 - MAE의 단점 1. ..

정리/평가지표 2022.05.11
반응형