정리 8

[토이 데이터셋] Scikit-Learn 라이브러리의 Datasets 패키지

Scikit-Learn 라이브러리의 Datasets 패키지 일반적으로 모델의 학습에 사용할 데이터는 사용자가 직접 파일 형태로 다운을 받은 후에 코드상으로 불러와야 합니다. 하지만, Scikit-Learn 라이브러리에서는 함수의 형태로 몇개의 데이터를 손쉽게 가져올 수 있습니다. Scikit-Learn 라이브러리는 기계학습(Machine Learning, ML) 모델을 구현하는데 있어서 가장 많이 사용하는 라이브러리 중 하나이며, Scikit-Learn에서 제공하는 데이터에는 Toy Dataset과 Real World Dataset이 있습니다. Toy Dataset은 실제 모델을 학습하여 좋은 성능을 이끌어 내기에는 크기가 작은 데이터셋을 말합니다. 크기가 작기 때문에 일종의 장난감(Toy)처럼 다양한 ..

[평가지표] Symmetric Mean Absolute Percentage Error (SMAPE)

Symmetric Mean Absolute Percentage Error (SMAPE) 설명 Symmetric Mean Absolute Percentage Error (SMAPE)는 회귀 모델 (Regression Model)이 잘 학습되었는지를 확인할 때 사용하는 평가지표입니다. SMAPE는 Mean Absolute Percentage Error (MAPE)가 가진 한계점을 보완하기 위하여 고안된 평가지표이며, MAPE는 오차를 실제값으로 나누는 반면 SMAPE는 실제 값과 예측값의 평균으로 나누어 구합니다. SMAPE도 확률 값을 도출하지만 MAPE와는 다르게 최대 200%까지 값이 도출될 수 있습니다. 따라서, 일반적인 SMAPE 수식에 2를 나누어준 후 사용하기도 합니다. SMAPE는 MAPE와 ..

정리/평가지표 2022.06.08

[평가지표] Mean Percentage Error (MPE)

Mean Percentage Error (MPE) 설명 Mean Percentage Error (MPE)는 회귀 모델 (Regression Model)이 잘 학습되었는지를 확인할 때 사용하는 평가지표입니다. MPE는 Mean Absolute Percentage Error (MAPE)에서 절대값을 제외한 지표이며, MAPE와 다르게 오차에 절대값을 씌어주지 않을 상태로 계산되기 때문에 음수값도 나올 수 있다는 점이 가장 큰 차이점이라고 할 수 있습니다. MAPE는 값이 0에 가까워질수록 모델이 잘 학습되었다는 것을 의미하지만 MPE는 0에 가까워졌다고 하더라도 모델이 잘 학습되었다고 말할 수 없습니다. ※ MAPE에 대한 설명은 아래 링크에서 확인할 수 있습니다. 2022.05.12 - [정리/평가지표] ..

정리/평가지표 2022.06.04

[평가지표] Mean Error (ME)

Mean Error (ME) 설명 Mean Error (ME)는 Mean of Error, Average Error 등 다양한 용어로 불릴 수 있으며, 회귀 모델 (Regression Model)이 잘 학습되었는지를 확인할 때 사용할 수 있는 평가지표 입니다. ME는 실제 정답 값과 예측 값의 차이를 단순하게 산술 평균한 값 입니다. ME의 수식은 아래와 같습니다. 수식에서 $Y_{i}$은 실제 정답 값을 의미하고, $\widehat{Y}_{i}$은 예측 값을 의미합니다. ME의 장단점 - ME의 장점 1. 가장 간단하게 계산이 가능한 평가지표 2. 양의 오차와 음의 오차가 상쇄되기 때문에 예측 모델이 실제 정답 값보다 높게 예측하였는지, 낮게 예측하였는지를 파악하는데 사용될 수 있음 - ME의 단점 1..

정리/평가지표 2022.06.03

[평가 지표] Root Mean Square Error (RMSE)

Root Mean Square Error (RMSE) 설명 Root Mean Square Error (RMSE)는 회귀 모델 (Regression Model)이 잘 학습되었는지를 확인할 때 많이 사용되는 평가지표입니다. RMSE는 실제 정답 값과 예측 값의 차이를 제곱한 후 평균을 구하여 도출 가능한 평균 제곱 오차(Mean Squared Error, MSE)에 제곱근을 씌어 구할 수 있으며, 값이 작을수록 모델의 성능이 좋다는 것을 의미합니다. MSE와 전반적인 특징은 유사하지만 제곱근이 씌어져있기 때문에 실제 정답값과 같은 단위를 갖는 평가지표입니다. ※ MSE에 대한 설명은 아래 링크에서 확인할 수 있습니다. 2022.05.14 - [정리] - [평가 지표] Mean Squared Error (MS..

정리/평가지표 2022.06.02

[평가 지표] Mean Squared Error (MSE)

Mean Squared Error (MSE) 설명 Mean Square Error (MSE)는 회귀 모델 (Regression Model)이 잘 학습되었는지를 확인할 때 많이 사용되는 평가지표입니다. MSE는 실제 정답 값과 예측 값의 차이를 제곱한 후 평균을 구하여 도출할 수 있으며, 값이 작을수록 모델의 성능이 좋다는 것을 의미합니다. MSE의 수식은 아래와 같습니다. 수식에서 $Y_{i}$은 실제 정답 값을 의미하고, $\widehat{Y}_{i}$은 예측 값을 의미합니다. MSE의 장단점 - MSE의 장점 1. Mean Absolute Error(MAE)와 더불어 가장 직관적인 평가지표 중 하나 - MSE의 단점 1. 오차를 제곱하기 때문에 이상치에 민감하게 변화함 2. 오차를 제곱하기 때문에 회..

정리/평가지표 2022.05.14

[평가 지표] Mean Absolute Percentage Error (MAPE)

Mean Absolute Percentage Error (MAPE) 설명 Mean Absolute Percentage Error (MAPE)는 회귀 모델 (Regression Model)이 잘 학습되었는지를 확인할 때 많이 사용되는 평가지표입니다. Mean Absolute Error (MAE)와 비슷하지만 실제 정답 값을 나누어 도출한 확률 값이라는 점이 가장 큰 차이점 이라고 할 수 있습니다. MAPE는 MAE와 동일하게 값이 작을수록 모델의 성능이 좋다는 것을 의미합니다. ※ MAE에 대한 설명은 아래 링크에서 확인할 수 있습니다. 2022.05.11 - [정리] - [평가 지표] Mean Absolute Error (MAE) MAPE의 수식은 아래와 같습니다. 수식에서 $Y_{i}$은 실제 정답 값..

정리/평가지표 2022.05.12

[평가 지표] Mean Absolute Error (MAE)

Mean Absolute Error (MAE) 설명 Mean Absolute Error (MAE)는 회귀 모델 (Regression Model)이 잘 학습되었는지를 확인할 때 많이 사용되는 평가지표입니다. MAE는 실제 정답 값과 예측 값의 차이를 절댓값으로 변환한 뒤 평균을 구하여 도출할 수 있으며, 값이 작을수록 모델의 성능이 좋다는 것을 의미합니다. MAE의 수식은 아래와 같습니다. 수식에서 $Y_{i}$은 실제 정답 값을 의미하고, $\widehat{Y}_{i}$은 예측 값을 의미합니다. MAE의 장단점 - MAE의 장점 1. 실제 정답 값, 예측 값과 같은 단위를 가지는 평가지표이기 때문에 결과 해석이 용이함 2. 절대값을 취하기 때문에 직관적으로 결과를 해석할 수 있음 - MAE의 단점 1. ..

정리/평가지표 2022.05.11
반응형