본문 바로가기 메뉴 바로가기

데이터 사이언스 데이

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

데이터 사이언스 데이

검색하기 폼
  • 분류 전체보기 (18)
    • 데이터 분석 (18)
  • 방명록

분류 전체보기 (18)
의사결정 트리(decision tree) 개념, 적용 분야, 주의할 점

의사결정 트리 개념 의사결정 트리(decision tree)는 분류 작업과 회귀 작업 모두에 사용되는 인기 있는 머신 러닝 알고리즘으로, 내부 노드는 특징 또는 속성을 나타내고, 분기 노드는 의사결정 규칙을 나타내며, 각 리프 노드는 결과 또는 결과를 나타내는 트리 성격을 띠는 모델입니다. 의사결정 트리의 작동 방식은 다음과 같습니다. 먼저 최상단에 Root Node가 있습니다. 이것은 전체 데이터셋을 나타내는 최상위 노드로, 2개 이상의 동질적인 집합으로 나뉩니다. 그 밑에는 의사결정 노드(내부 노드)가 있습니다. 이 노드들은 데이터셋을 특정한 특징이나 속성에 따라 하위 집합으로 나눕니다. 이때 분기를 통해 노드를 나뉘는데, 분기는 각 내부 노드에서 데이터가 분할되는 결정 규칙 또는 조건을 나타냅니다...

데이터 분석 2023. 11. 11. 08:50
데이터 분석에서 차원 축소를 하는 이유, 방법, 장점

차원 축소(dimension reduction)를 하는 이유 실제 문제와 실제 데이터를 처리할 때 우리는 종종 수백만 개까지 올라갈 수 있는 고차원 데이터를 처리합니다. 데이터는 원래의 고차원 구조에 있지만 데이터 자체가 가장 잘 나타나므로 때때로 데이터 차원을 줄여야 할 수 있습니다. 차원성을 줄여야 할 필요성은 종종 시각화와 관련이 있지만(2-3차원으로 축소) 항상 그렇지는 않습니다. 때로는 거리 계산과 같은 문제로 정밀도보다 성능을 중시하여 1,000차원 데이터를 10차원으로 줄일 수 있으므로 더 빠르게 조작할 수 있습니다. 차원성을 줄여야 하는 필요성은 현실적이며 많은 응용 프로그램이 있습니다. 여기서는 PCA, t-SNE 및 auto-encoder의 세 가지 차원 축소 기술을 중심으로 다루어 보..

데이터 분석 2023. 11. 10. 18:44
서포트 벡터 머신의 개념, 사용 시 이점, 응용 분야

서포트 벡터 머신의 개념 서포트 벡터 머신(SVM)은 최대 마진 분류기로 최적화 문제를 공식화하는 방법에 따라 분류 또는 회귀 분석을 수행할 수 있는 알고리즘입니다. 즉, 데이터가 두 클래스로 분리되면 SVM은 데이터를 최대로 분리하는 하이퍼플레인(즉, 하이퍼플레인이 두 클래스에서 가장 멀리 떨어져 있음)을 찾으려고 시도합니다. 또한 하드 마진과 소프트 마진 SVM의 개념도 있는데, 근본적인 차이는 하드 마진 SVM은 선형으로 분리 가능한 데이터에 대해서만 작동하고 소프트 마진 SVM은 일부 오분류가 발생할 수 있는 여지가 있으며, 이는 모델에서 매개 변수 C로 정량화됩니다. 소프트 마진 SVM은 일반적으로 우리가 실제로 SVM에 대해 말할 때 의미하는 바입니다. 커널(kernel)은 SVM 이론의 하나..

데이터 분석 2023. 11. 10. 15:52
교차 검증의 개념, 목적, 방법

교차 검증이란? 교차 검증은 모형의 예측 정확도를 추정하는 방법입니다. 모델을 평가하는 한 가지 방법은 모델에 적합한 데이터를 얼마나 잘 예측하는지를 보는 것입니다. 하지만 이것은 너무 낙관적입니다. 특정 데이터 집합에 맞춘 모델은 새로운 데이터보다 해당 데이터 집합에 대해 더 나은 예측을 할 수 있습니다. 또 다른 방법은 일부 데이터를 홀드하고 나머지 데이터를 사용하여 모델을 맞추는 것입니다. 그런 다음 홀딩된 데이터에 대한 정확도를 테스트할 수 있습니다. 교차 검증은 이와 같이 수행되지만 데이터를 보다 효율적으로 사용하려고 합니다. 데이터를 10개의 동등한 부분으로 나눈 다음 각 부분을 연속적으로 홀드 하고 나머지 부분을 사용하여 모형을 적합시킵니다. 이를 통해 예측 정확도의 추정치 10개를 전체 측..

데이터 분석 2023. 11. 9. 18:08
이전 1 2 3 4 5 다음
이전 다음

Blog is powered by Tistory / Designed by Tistory

티스토리툴바