
KNN 개념 k-nearest neighbors의 줄임말인 KNN은 데이터 과학 및 기계 학습에서 분류 및 회귀 작업 모두에 널리 사용되는 알고리즘으로 입력된 데이터 포인트 간의 유사성을 기반으로 예측을 수행하는 비모수적 방법입니다. KNN에서 "k"는 예측을 할 때 고려되는 가장 가까운 이웃의 수를 나타냅니다. 새로운 라벨이 부착되지 않은 데이터 포인트가 주어지면 알고리즘은 선택된 거리 메트릭(유클리드 거리 등)에 기초하여 학습 세트에서 가장 가까운 라벨이 부착된 k개의 데이터 포인트를 찾습니다. 그런 다음 새로운 데이터 포인트의 예측 클래스 또는 값은 k개의 가장 가까운 이웃 간의 다수결(분류를 위한) 또는 평균(회귀를 위한)에 의해 결정됩니다. KNN의 주요 가정은 특징 공간에서 서로 가까운 데이터..
데이터 분석
2023. 11. 14. 18:50