반응형
SMALL



1. 데이터 과학의 개념


빅데이터 시대에 접어들면서 데이터 분석을 담당하는 사람들에게 주어진 업무의 범주가 훨씬 확대되었으며, 과학적이고 합리적인 방법과 분별능력이 더욱 요구되고 있다. 엄청난 양의 데이터가 쏟아져 나오는 현 시점에서는 데이터과학의 중요성이 날로 부각될 수밖에 없다.
데이터 과학은 데이터를 수집하여 그 의미를 찾아내는 다양한 시도에 의해 형성되어 왔다. 빅데이터 시대 이후의 데이터과학은 데이터 분석에 국한하지 않고 IT 기술의 접목을 통해 데이터의 크기나 형태에 상관없이 데이터의 가치를 찾는 능력을 의미한다. 과학적 기법이 개발되고 개선되고 적용되면서 데이터 과학은 발전을 거듭하고 있다. 이러한 데이터 과학이라는 틀 안에서 통계학적 사고와 이해는 데이터 과학의 발전에 필수적인 요소로 작용하고 있다.

2. 데이터 과학의 발전과정


데이터 과학의 역사를 데이터 수집의 역사로 정의하고 있다. 즉 데이터의 어원 ‘datum’이라는 말이 우리에게 주어진 것, 즉 ‘things given’을 뜻한다는 점에서, 이를 찾아내어 과학적 대상으로 삼아 바로 조명함으로써 데이터 과학의 기반을 갖추어지게 되었다는 것이다.

(1) 데이터의 수집 및 분석의 역사
데이터의 수집과 분석의 역사는 성경에도 기록되어 있듯이 수천년 전부터 있었던 일이겠지만, 현대적 의미의 데이터 분석은 영국의 로널드 피셔 경(Sir Ronald Fisher)으로부터 비롯되었다고 할 수 있다. 로담스테드 연구소에서 수행한 수년간의 곡물 관련 실험결과를 연구하며 실험조건에 따른 그 결과 혹은 반응에 관한 데이터로 실험조건은 질적인 변수로, 실험결과는 양적인 변수로 표현한 것이 실험계획법의 토대가 되었다. 로널드 피셔 경이 통제된 실험에 의해 생산된 데이터를 취득하여 분석하였다면, 조지 갤럽(George Gallup)은 사람들의 생각을 질문이나 문항을 통해 데이터로 수집하기 시작한 사람이다. 여론조사의 새로운 장을 연 인물이다. 한편 공학자였던 윌리엄 페어(William Fair)와 수학자 얼 아이작(Earl Issac)은 현대적 의미의 고객행동을 예측하여 의사결정과 현계한 개념을 최초로 소개하였으며 공학자이자 통계학자인 다구치 박사는 품질관리의 새 지평을 열었다. 이러한 기초적인 데이터 수집과 분석에 대한 노력은 데이터에 관한 이해가 핵심 역량이 되는 빅데이터 시대를 이룩하는 밑거름이 되었다고 할 수 있다.

(2) 데이터 과학의 발전 배경
데이터 과학의 발전은 IT 기술의 발달과 궤를 같이한다고 할 수 있다. IT 기술의 발전과 더불어 비용도 낮아져 기존 분석환경을 극복할 수 있었던 것이다. 데이터 분석을 기업에 본격적으로 도입하게 된 계기는 데이터 웨어하우스(data warehouse)의 보급과 도입이라고 할 수 있다. 데이터 웨어하우스는 분석이나 의사결정 지원을 위한 본격적인 데이터 축적 및 관리, 더 나아가 활용의 기반을 다지기 시작한 시작점이라 할 수 있다.
데이터 과학의 발전을 위해서는 데이터 웨어하우스 구축과 더불어 능력 있는 데이터 분석가와 다양하며 복작합 형태의 데이터를 다룰 수 있는 새로운 데이터 분석방법이 필요했다. 이러한 데이터 분석 및 활용 관점에서 각광받기 시작한 것이 바로 데이터 마이닝이다.

반응형
LIST
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기