Data Sience란?
- 데이터 마이닝과 유사하게 정형, 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트를 추출하는데 과학적 방법론, 프로세스, 알고리즘, 시스템을 동원하는 융합분야다.
- 데이터 과학은 데이터를 통해 실제 현상을 이해하고 분속하는데 통계학, 데이터 분석, 기계학습과 연관된 방법론을 통합하는 개념으로 정의되기도 한다.
- 데이터 과학은 생물학, 의학, 공학, 사회학, 인문과학 등의 여러 분야에 응용되고 있다.
데이터 분석의 필요성
- 인간의 감에 의한 의사결정이 아니라 데이터 분석에 기반한 합리적이고 효율적인 의사결정의 중요성이 대두됨
- 대부분의 비즈니스가 IT기반 비즈니스로 옮겨가면서 분석을 위한 다양한 대량의 데이터를 손쉽게 구할 수 있는 환경이 조성됨
머신러닝과 AI가 필요한 이유
- 머신러닝 방법론을 이용할 경우, 인간이 정확히 하나하나 로직을 지정해주기 어려운 복잡한 문제를 데이터에 기반한 학습을 통해서 해결 할 수 있다.
- 머신러닝 알고리즘을 사용할 때 가장 중요한 부분은 머신러닝 모델이 잘 학습할 수 있도록 적절한 특징을 설정해 주는 것이다.
Data Science분야에서 요구되는 다양한 니즈들
데이터 사이언스 관련 직군
Data Scientist : 데이터에 대한 가설을 설정하고, 데이터를 분석하고, 분석한 데이터로 파악한 특징을 시각화해서 다른 사람들과 공유한다.
Data Engineer : Data Science 프로젝트 진행을 위한 데이터 수집 및 전처리, 학습된 모델의 안정적인 배포를 위한 인프라 등을 개발
ML/AI Engineer : Data Science 프로젝트 진행을 위한 새로운 머신러닝/인공지능 모델을 개발
'AI, 딥러닝, 머신러닝' 카테고리의 다른 글
인공신경망(2) (0) | 2023.02.07 |
---|---|
인공 신경망 (1) (0) | 2023.02.06 |
선형 회귀(Linear Regression) 알고리즘 (0) | 2023.02.05 |
머신러닝 알고리즘의 3가지 분류 (0) | 2023.01.28 |
딥러닝(Deep Learning)이란 무엇인가? (1) | 2023.01.25 |