
지도 학습 지도 학습은 레이블이 지정된 데이터 세트에 다른 특징 또는 매개 변수가 부여되는 일종의 기계 학습입니다. 주어진 데이터 세트에서 일부 데이터 세트를 사용하여 모델을 훈련하고 일부 다른 부분을 테스트하여 새로운 데이터 또는 특징을 예측합니다. 지도 학습의 목표는 모델이 보이지 않는 입력 데이터의 출력 레이블을 정확하게 예측할 수 있는 매핑 함수를 학습하는 것입니다. 모델은 레이블이 지정된 예제에서 학습하고 지식을 일반화하여 보이지 않는 새로운 데이터에 대해 예측을 수행합니다. 예를 들어, 우리는 두 개의 특징 점수와 학습 시간을 가진 백만 명의 학생 데이터 세트를 가지고 있습니다. 따라서 평균적인 학생의 주어진 학습 시간을 기반으로 우리는 학생이 받은 점수를 예측해야 합니다. 지도 학습에는 두 ..

기술통계 정의 기술통계란 데이터셋의 주요 특징, 패턴, 특징 등을 요약하고 설명하기 위해 사용되는 통계적 기법의 집합을 의미합니다. 데이터의 중심적인 성향, 변동성, 분포 등에 대한 의미 있는 정보를 제공하기 위해 데이터를 구성, 제시, 분석하는 것을 포함합니다. 기술 통계량은 모집단 값이 아닌 표본 값의 분포를 설명하는 데 사용되는 통계량입니다. 데이터를 보거나 그림을 그릴 필요 없이 데이터에 대한 느낌을 얻기 위해 사용됩니다. 참고로, 기술 통계량은 오해를 불러일으킬 수 있으므로 가능하면 항상 데이터를 살펴야 합니다. 기술통계학의 가장 큰 두 범주는 중심적 경향성과 분산성입니다. 중심 성향의 척도는 평균, 중위수, 최빈값(통계), 중위수 등으로 측정을 합니다. 반면 분산 측정은 다음과 같습니다. 범위..