티스토리 뷰
머신러닝이란?
머신 러닝은 컴퓨터가 데이터를 통해 학습하고 명시적인 지시 없이 스스로 결정을 내리는 것입니다. 이는 컴퓨터가 데이터의 예시와 패턴을 통해 학습하도록 가르치는 것과 같아서 정확히 무엇을 해야 하는지 듣지 않고도 작업을 할 수 있습니다. 이를 통해 컴퓨터는 향상되고 여러분이 좋아하는 것을 예측하거나 자율적으로 자동차를 운전할 수 있는 것과 같은 것을 할 수 있습니다. 컴퓨터에게 사과와 오렌지 같은 서로 다른 과일을 인식하도록 가르치고 싶다고 가정합니다. 규칙 목록을 주는 대신, 여러분은 컴퓨터에게 사과와 오렌지의 사진을 많이 보여줍니다. 컴퓨터는 사진에서 패턴을 찾습니다. 아마도 컴퓨터는 사진에서 패턴을 찾을 수 있습니다. 아마 사과는 둥글고 빨갛거나 초록색인 반면 오렌지는 둥글고 오렌지색이라는 것을 알아차릴 수 있을 것입니다. 많은 예를 본 후에, 컴퓨터는 스스로 사과와 오렌지의 차이점을 구분하는 것을 배웁니다. 그런 다음, 여러분이 과일의 새로운 사진을 보여줄 때, 예에서 배운 것을 바탕으로 그것이 사과인지 오렌지인지 추측할 수 있습니다. 이것이 기계 학습이 작동하는 방법입니다. 컴퓨터는 데이터로부터 학습하고 그 학습을 결정이나 예측을 하는 데 사용합니다.
딥러닝은 머신러닝의 하위 집합
머신러닝은 데이터를 구문 분석하고, 해당 데이터로부터 학습한 다음, 배운 내용을 적용하여 정보에 입각한 결정을 내리는 기술입니다. 많은 대기업에서 사용자에게 더 나은 경험을 제공하기 위해 기계 학습을 사용합니다. 예를 들어 Amazon은 기계 학습을 사용하여 고객의 선호도에 따라 더 나은 제품 선택 권장 사항을 제공하고 Netflix는 기계 학습을 사용하여 더 나은 추천 시스템을 제공합니다. TV 시리즈나 영화, 쇼를 시청하고 싶은 사용자에게 제공합니다. 딥러닝은 실제로 머신러닝의 하위 집합입니다. 기술적으로는 기계 학습이며 동일한 방식으로 작동하지만 기능이 다릅니다.
딥러닝과 머신러닝의 주요 차이점
몇 가지 주요 차이점이 이 두 개념을 구분합니다. 딥러닝에는 더 많은 양의 훈련 데이터가 필요하지만 자체 환경과 실수를 통해 학습합니다. 머신러닝은 더 작은 데이터 세트에 대한 교육을 가능하게 하지만 학습하고 실수를 수정하려면 더 많은 사람의 개입이 필요합니다. 머신러닝의 경우, 데이터에 라벨을 붙이고 그 특성을 나타내기 위해 인간이 개입해야 합니다. 반면 딥러닝 시스템은 사람의 개입 없이 이러한 특성을 학습하려고 시도합니다. 예를 들어 얼굴 인식의 경우 딥러닝 프로그램은 먼저 얼굴의 경계선과 선을 감지하고 인식하는 방법을 학습합니다. 그런 다음 얼굴의 가장 중요한 부분을 학습하고 마지막으로 얼굴의 일반적인 표현을 학습합니다. 이를 위해서는 엄청난 양의 데이터가 필요하지만 훈련이 진행됨에 따라 성공 확률이 높아집니다. 접근 방식은 근본적으로 다릅니다. 기계 학습 알고리즘은 데이터를 여러 부분으로 분리한 다음 결합하여 결과나 솔루션을 제안하는 경향이 있습니다. 반면 딥러닝 시스템은 문제 전체를 고려합니다. 기계 학습에는 훈련 시간이 덜 필요하지만 정밀도 수준은 낮습니다. 딥러닝을 통해 기계는 데이터 간의 복잡하고 비선형적인 상관관계를 만들 수 있습니다. 딥 러닝 훈련은 처리할 데이터의 양이 많고 관련 매개변수와 수학 공식이 많기 때문에 훨씬 더 오랜 시간이 걸립니다. 머신 러닝 시스템은 몇 초 또는 몇 시간 만에 학습할 수 있는 반면, 딥 러닝은 몇 주가 걸릴 수 있습니다. 마지막으로, 머신러닝은 CPU(중앙 처리 장치)에서 훈련할 수 있는 반면, 딥 러닝에는 GPU(그래픽 처리 장치)가 필요합니다. 이 강력한 하드웨어는 대용량 데이터를 처리하고 복잡한 알고리즘 계산을 수행하는 데 필수적입니다. 차이점을 고려하면 머신러닝과 딥러닝은 서로 다른 애플리케이션에 사용됩니다. 기계 학습은 금융이나 날씨에 대한 예측 프로그램, 이메일 스팸 식별자 또는 환자를 위한 맞춤형 치료법을 설계하는 프로그램에 활용됩니다. 딥러닝은 스트리밍 서비스 추천, 안면인식뿐 아니라 자율주행차에도 활용된다. 신경망 덕분에 자동차는 피해야 할 물체를 결정하고, 신호등과 표지판을 인식하고, 속도를 높이거나 낮춰야 할 시기를 알 수 있습니다.
'데이터 분석' 카테고리의 다른 글
TF-IDF 설명, 장단점, word2vec 비교 (0) | 2023.11.16 |
---|---|
KNN 개념 및 적용 방법, 알고리즘 비교를 통한 이해 (0) | 2023.11.14 |
로지스틱 회귀의 개념, 장점 및 한계, 소프트맥스와의 차이점 (0) | 2023.11.13 |
클러스터링 기법 소개, 알고리즘 종류, 사용 예시 (0) | 2023.11.11 |
의사결정 트리(decision tree) 개념, 적용 분야, 주의할 점 (0) | 2023.11.11 |