반응형
SMALL

 

 

1. 데이터란 무엇인가?

일반적으로 데이터는 관심 있는 어떤 주제에 대해서 수집된 구조화된 정보(organized information)로 정의할 수 있다. 여기서 일반적인 의미의 데이터는 수치, 문자, 그림 등의 표현양식과 관계없이 어떤 주제에 대한 구조화된 정보를 뜻한다. 데이터가 갖는 몇 가지 특징에 대해서 살펴보자.

 

첫째. 데이터는 구조화되어 있어야 한다. 어떤 조사대상에 대해서 데이터를 수집하고자 한다면 데이터의 분석에 알맞은 일정한 규칙과 형태로 수집되고 정리되어야 한다. 특히 엑셀과 같은 스프레드시트나 SAS, SPSS, R 등의 통계패키지를 이용하여 데이터를 분석하고자 한다면 각각의 소프트웨어에서 규정하는 형태로 데이터가 마련되어 있어야 분석할 수 있다.

 

둘째. 데이터는 분석과정을 통해서 유용한 정보가 된다. 데이터는 분석과정을 통해서 어떤 주제에 대하여 적절하고, 널리 통용될 수 있고, 깊이 있는 정보가 될 수 있다. 즉, 데이터는 쓸모 있는 정보를 담고 있어야 한다. 그렇지 않으면 분석된 결과는 쓸모없는 것에 불과하게 된다.

 

셋째. 데이터는 수집되는 것이다. 데이터는 여러 방법으로 수집되는데, 대개 수집된 데이터는 차후의 분석을 위해서 알맞은 형태로 변환하는 과정을 거치게 된다. 일반적으로 데이터는 통계조사나 실험 또는 관측을 통해서 얻어지는데, 경우에 따라서는 이미 존재하는 데이터베이스에서 얻어지기도 한다.

 

넷째. 데이터는 어떤 주제 또는 관심 있는 주제에 대한 것이라야 한다. 데이터는 어떤 주제에 대한 구체적인 필요에 의해서 얻어진 것이다.

특히 좀 더 세분해서 통계적 데이터(statistical data)를 정의하면, 수치적 계산에 알맞은 또는 수치적 계산을 할 수 있는 데이터를 의미한다. 예를 들어, 어떤 시험에서 학생들이 얻은 점수들은 바로 수치적으로 계산할 수 있는 통계적 데이터인 것이다. 즉, 통계적 데이터란 통계분석을 통해서 좀 더 유용한 결과를 얻을 수 있는 데이터를 의미하는 것이다.

 

우리가 데이터를 수집하고, 정리하여 분석하는 목적은 다양하지만, 그 중에서 중요한 몇 가지를 정리하면 다음과 같다.

1. 데이터 수집과 분석이 기술적인 목적인 경우이다. 데이터 분석은 어떤 집단의 현상이나 특성 등을 있는 그대로 기술함으로써 자연현상이나 사회현상을 좀 더 정확하게 파악할 목적으로 진행된다.

2. 단순한 현상의 파악에서 한 걸음 더 나아가 어떤 현상의 인과관계를 밝힘으로써 그러한 현상이 왜 나타나게 되었는지를 규명하는 것이다.

3. 데이터를 수집하고 분석함으로써 경제현상이나 사회현상 속에 숨어 있는 법칙성을 발견할 수 있고, 이를 바탕으로 미래상황의 전개를 예측하여 합리적인 의사결정에 도움을 줄 수 있다.

 

1) 데이터 수집방법

데이터는 일반적으로 관찰, 통계조사, 실험 등을 통해서 수집되는데 표본으로 추출된 조사단위나 실험에서의 실험단위로부터 정해진 측정방법에 따라 측정하여 얻게 된다. 측정은 각각의 조사단위의 어떤 특성을 일정한 기준에 따라 관측하여 각 조사단위에 수치를 부여하는 작업으로 정의할 수 있다. 예를 들어, 표본으로 뽑힌 사람들의 몸무게, 지능 혹은 취업상태 등을 관측하여 수치로 나타낸다면 일종의 측정이라고 할 수 있다. 여기서 측정된 전체 자료를 데이터(data)라고 한다.

반응형
LIST
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기