본문 바로가기 메뉴 바로가기

데이터 사이언스 데이

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

데이터 사이언스 데이

검색하기 폼
  • 분류 전체보기 (18)
    • 데이터 분석 (18)
  • 방명록

데이터 분석 (18)
KNN 개념 및 적용 방법, 알고리즘 비교를 통한 이해

KNN 개념 k-nearest neighbors의 줄임말인 KNN은 데이터 과학 및 기계 학습에서 분류 및 회귀 작업 모두에 널리 사용되는 알고리즘으로 입력된 데이터 포인트 간의 유사성을 기반으로 예측을 수행하는 비모수적 방법입니다. KNN에서 "k"는 예측을 할 때 고려되는 가장 가까운 이웃의 수를 나타냅니다. 새로운 라벨이 부착되지 않은 데이터 포인트가 주어지면 알고리즘은 선택된 거리 메트릭(유클리드 거리 등)에 기초하여 학습 세트에서 가장 가까운 라벨이 부착된 k개의 데이터 포인트를 찾습니다. 그런 다음 새로운 데이터 포인트의 예측 클래스 또는 값은 k개의 가장 가까운 이웃 간의 다수결(분류를 위한) 또는 평균(회귀를 위한)에 의해 결정됩니다. KNN의 주요 가정은 특징 공간에서 서로 가까운 데이터..

데이터 분석 2023. 11. 14. 18:50
머신러닝의 개념, 딥러닝과의 주요 차이점

머신러닝이란? 머신 러닝은 컴퓨터가 데이터를 통해 학습하고 명시적인 지시 없이 스스로 결정을 내리는 것입니다. 이는 컴퓨터가 데이터의 예시와 패턴을 통해 학습하도록 가르치는 것과 같아서 정확히 무엇을 해야 하는지 듣지 않고도 작업을 할 수 있습니다. 이를 통해 컴퓨터는 향상되고 여러분이 좋아하는 것을 예측하거나 자율적으로 자동차를 운전할 수 있는 것과 같은 것을 할 수 있습니다. 컴퓨터에게 사과와 오렌지 같은 서로 다른 과일을 인식하도록 가르치고 싶다고 가정합니다. 규칙 목록을 주는 대신, 여러분은 컴퓨터에게 사과와 오렌지의 사진을 많이 보여줍니다. 컴퓨터는 사진에서 패턴을 찾습니다. 아마도 컴퓨터는 사진에서 패턴을 찾을 수 있습니다. 아마 사과는 둥글고 빨갛거나 초록색인 반면 오렌지는 둥글고 오렌지색이..

데이터 분석 2023. 11. 14. 00:49
로지스틱 회귀의 개념, 장점 및 한계, 소프트맥스와의 차이점

로지스틱 회귀란? 로지스틱 회귀(Logistic Regression)는 주로 이진 분류(binary classification) 문제에 사용되는 통계적인 머신러닝 모델입니다. 이 모델은 선형 회귀를 기반으로 하지만, 출력을 로지스틱 함수에 통과시켜 확률 값을 생성하고, 이를 기반으로 예측을 수행합니다. 이를 통해 출력값을 0과 1 사이로 제한하면서 이진 분류를 수행할 수 있습니다. 로지스틱 회귀는 선형 회귀의 아이디어를 기반으로 하며, 주어진 입력 특성에 대해 선형 결합을 계산합니다. 로지스틱 회귀에서는 이 선형 결합을 확률로 변환하기 위해 로지스틱 함수(시그모이드 함수)를 사용합니다. 로지스틱 함수는 z를 0과 1 사이의 값으로 압축시키는 역할을 합니다. z가 양수면 1에 가까워지고, 음수면 0에 가까..

데이터 분석 2023. 11. 13. 20:19
클러스터링 기법 소개, 알고리즘 종류, 사용 예시

클러스터링 기법이란? 클러스터링은 비지도 학습(unsupervised learning) 방법의 하나입니다. 이 알고리즘은 데이터를 유사한 특성을 가진 그룹으로 나누는 과정입니다. 이때 이 그룹을 '클러스터'라고 합니다. 클러스터링은 데이터 내의 패턴이나 구조를 발견하고, 유사한 데이터를 함께 그룹화하여 이해하기 쉽게 만드는 데 사용됩니다. 클러스터링의 목적은 데이터 안에 숨겨진 구조를 찾아내거나 유사한 데이터를 동일한 집단으로 묶어서 데이터를 보다 이해하기 쉽게 하기 위한 것입니다. 관련 알고리즘 종류 다양한 클러스터링 알고리즘이 있지만, 그 중 몇 가지 대표적인 알고리즘에 대해 설명하겠습니다. 첫째, K-Means 클러스터링입니다. 데이터를 K개의 클러스터로 그룹화하는 것입니다. 각 클러스터는 중심(c..

데이터 분석 2023. 11. 11. 16:20
이전 1 2 3 4 5 다음
이전 다음

Blog is powered by Tistory / Designed by Tistory

티스토리툴바