AI, 딥러닝, 머신러닝

Data Sience란 무엇인가?

Mulenga 2023. 1. 26. 11:58
728x90

Data Sience?

- 데이터 마이닝과 유사하게 정형, 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트를 추출하는데 과학적 방법론, 프로세스, 알고리즘, 시스템을 동원하는 융합분야다.

 

- 데이터 과학은 데이터를 통해 실제 현상을 이해하고 분속하는데 통계학, 데이터 분석, 기계학습과 연관된 방법론을 통합하는 개념으로 정의되기도 한다.

 

- 데이터 과학은 생물학, 의학, 공학, 사회학, 인문과학 등의 여러 분야에 응용되고 있다.

 

데이터 분석의 필요성

 

- 인간의 감에 의한 의사결정이 아니라 데이터 분석에 기반한 합리적이고 효율적인 의사결정의 중요성이 대두됨

 

- 대부분의 비즈니스가 IT기반 비즈니스로 옮겨가면서 분석을 위한 다양한 대량의 데이터를 손쉽게 구할 수 있는 환경이 조성됨

 

머신러닝과 AI가 필요한 이유

 

- 머신러닝 방법론을 이용할 경우, 인간이 정확히 하나하나 로직을 지정해주기 어려운 복잡한 문제를 데이터에 기반한 학습을 통해서 해결 할 수 있다.

 

- 머신러닝 알고리즘을 사용할 때 가장 중요한 부분은 머신러닝 모델이 잘 학습할 수 있도록 적절한 특징을 설정해 주는 것이다.

 

Data Science분야에서 요구되는 다양한 니즈들

 

 

데이터 사이언스 관련 직군

 

Data Scientist : 데이터에 대한 가설을 설정하고, 데이터를 분석하고, 분석한 데이터로 파악한 특징을 시각화해서 다른 사람들과 공유한다.

 

Data Engineer : Data Science 프로젝트 진행을 위한 데이터 수집 및 전처리, 학습된 모델의 안정적인 배포를 위한 인프라 등을 개발

 

ML/AI Engineer : Data Science 프로젝트 진행을 위한 새로운 머신러닝/인공지능 모델을 개발