통계학

From Opengenome.net
Statistics
집단현상을 수량적 비교를 통해 통계적으로 관찰·파악·처리·분석하는 방법에 관한 학문.


역사

인구·토지·생산물 등에 대한 통계 그 자체는 이미 고대 로마나 중국 등에서 만들어졌으나 학문으로서 형성된 것은 17세기 이후이다. 통계학의 전신으로는 영국의 정치산술(政治算術), 독일의 국상학(國狀學), 프랑스의 확률론 등 3가지를 들 수 있다. 사회인식의 실증적 방법에 통계적인 숫자를 사용한 선구자는 영국의 J. 그랜트로(J. Graunt, 1620∼1674), 그는 출생·사망 등에 관한 법칙성을 밝혀냈다. 또한 이러한 실증적 연구방법은 W. 페티(W. Petty, 1623∼1687)에 의해 더욱 발전되었고 이는 사회·경제의 수량 분석에 이용되었는데 이 방법들을 정치산술이라 한다. 독일에서는 H. 콜링에 의해 국가에 관한 여러 지식을 체계화하여 유럽 각국의 상황을 비교하는 국상학이 시작되었다. 또한 프랑스에서 우연현상의 수리를 다루는 확률론이 B. 파스칼·P. 페르마 등에 의해 개척되었고, J. 베르누이·C.F. 가우스 등에 의해 체계화되어 고전확률론이 성립되었다. 그의 저서 ‘사망표에 의한 자연적ㆍ지역적 고찰’에서 처음으로 사망표를 작성하고 남녀의 출생수, 결혼 상황 등을 기록 정리함으로써 사회적인 규칙성을 발견하려 노력하였다. 프랑스에서는 B. 파스칼(1623∼1662), P. 페르마(1601∼1665), P.S. 라플라스(1749∼1827) 등에 의해 현상을 수학적으로 관찰, 처리하는 방법이 수립되었다.

19세기 중엽 벨기에 천문학자 L.A.J. 케틀레(Quetelet, 1796∼1874)가 이 3가지 학문의 흐름을 종합하여 근대적인 통계학개념을 확립시켰다. 케틀레는 통계적 방법에 기초하여 사회인식을 위한 과학으로 사회물리학을 구상하였고, 관청통계의 확립과 통계의 국제적 보급에 힘썼다. 19세기 후반∼20세기 초에는 케틀레의 영향과 비판으로부터 케틀레의 통계학을 비판하는 독일의 <사회통계학>과 케틀레의 통계학을 더 진전시킨 영국 중심의 <수리통계학>이 발달하였다. 사회통계학은 G. 마이어에 의해 크게 발전하였고, 통계적 방법을 생물연구에 응용한 계량생물학(생물통계학)이 F. 골턴(1822∼1911)과 Karl 피어슨(Karl Pearson)에 의해 수립되었다. 
특히 골턴의 제자 피어슨은 대표본이론(大標本理論)을 중심으로 상관·회귀분석·검정·추정의 방법을 창안하였다. 골턴은 C.R. 다윈의 ‘종의 기원’에서 영향을 받아 유전학의 통계적 연구에 몰두하였고, 언제나 큰 변이를 나타내는 생물의 변수들 사이의 관계를 연구하기 위해 도수 분포의 개념, 오차의 이론 등을 도입하여 생물통계학의 기초를 다졌다. 그의 제자 K. 피어슨(1857∼1936)은 골턴의 배턴을 이어 받아 생물학우생학유전학에 있어서의 통계적 연구 방법을 확립하였으며, 실측값과 기대값과의 관계를 분명히 하기 위하여 카이제곱(X2) 검정법을 도입하는 등 생물통계학의 체계를 세움으로써 생물통계학, 혹은 생물측정학이라 불리는 학문이 발생하게 되었다. 피어슨은 골턴과 함께 1901년 <생물 통계(Biometrika)>를 창간하였는데, 이것은 현존하는 학술 잡지 중 가장 오래 된 것이다.  
20세기에 들어와서는 W.S. 고셋 (Gossett = Student), 영국 케임브리지의 진화생물학자인 ·R.A. 피셔(R. A. Fisher)에 의해 정밀표본이론이 개발되었고, J. 네이먼·E.S. 피어슨·A. 월드 등에 의해 통계적으로 추측이론이 정밀화되었다. 또한 피셔가 통계적 실험계획법을, 네이먼이 랜덤샘플링법(무작위추출)을 창안하였다. 이들 통계적 방법은 오늘날 컴퓨터의 발달과 함께 심리학·경제학·공학 등 여러 학문분야에 널리 응용되고 있다. 

통계학자

Wilcoxon

biochemist studied pesticides, non-parametric equivalent of two-samples test
Kruskal, Wallis economists who developed the non-parametric equivalent of the ANOVA
Spearman psychologist who developed a non-parametric equivalent of the correlation coefficient
Kendall statistician who developed another non-parametric equivalent the correlation coefficient
Tukey statistician who developed multiple comparisons procedure

Dunnett

biochemist who studied pesticides, developed multiple comparisons procedure for control groups
Keuls agronomist who developed multiple comparisons procedure


대상과 역할

통계학은 원래 사회과학에 속하는 학문으로, 사회집단의 수량적 측면을 반영하는 통계숫자를 어떻게 작성하느냐의 통계조사론과 그 가공·이용론을 주된 연구 대상으로 하였다. 그러나 19세기말∼20세기에 걸친 통계적 방법의 급속한 진보와 그 응용 영역의 확대에 따라 오늘날은 자연현상·사회현상의 구별없이 집단으로부터 추출된 통계숫자를 처리 분석하는 통계적 방법을 연구하는 학문이라는 견해가 지배적이다. 이와 같이 통계학을 통계의 작성, 그 가공·이용 및 통계적 방법에 관한 학문이라 한다면 그 내용은 사회통계·수리통계·응용통계의 3가지 영역으로 나눌 수 있다.


사회통계학

통계를 사회제도의 하나로 보고 이것을 연구하는 학문영역. 통계의 의의, 통계조사의 이론·방법, 통계제도·체계, 통계의 역사, 사회과학적 관점에서의 통계의 가공 및 이용법 등을 연구대상으로 한다. 통계는 사회집단을 대상으로 한 대량 관찰의 결과를 수량적으로 표현하는 것으로, 특히 사회통계학에서의 통계는 사회의 역사적 발전과정 중 각 시대의 사회적 요청이나 정부·지방자치단체의 행정활동의 필요에 의해서 작성되는 경우가 많다. 대부분 정부에 의해 작성되는데 이를 관청통계라 한다. 사회통계학의 중요한 과제는 사회제도로서 이 관청통계들의 역사적 성격과, 이로 인해 발생하는 사회적 제약을 밝혀내는 것이다. 통계학은, 통계가 무엇을 나타내는지를 분석하는 것을 주임무로 해야 한다는 실질과학설과, 통계는 사회과학 각 분야의 과제이고 통계학은 다만 통계적 방법의 의의를 논하는 것으로 한정시켜야 한다는 방법론설 내지 보조과학설로 나뉜다. 대부분의 나라에서는 방법론설을 통설로 받아들이고 있다.


수리통계학

일반적으로 집단현상에 관한 숫자데이터를 처리 분석하는 방법을 연구대상으로 한다. 이론통계학이라고도 한다. 수리통계학의 주요 분야에는 통계데이터의 분석법과 통계데이터의 작성법이 있다. 통계데이터의 분석법은 좁은뜻의 수리통계학으로, 기술통계학과 추측통계학의 2가지 분야로 이루어진다. 기술통계학은 숫자데이터를 정리, 요약하고 집단에 관한 도수분포·평균·표준편차·상관 등 통계해석적 관찰에 의거하여 분석 기술하는 것이다. 확률이론을 전제로 하는 추측통계학은 통계데이터의 대상의 변동성, 측정오차 등에 의한 우연적 변동을 확률적인 것으로 간주하고, 데이터로부터 객관적인 대상에 대한 판단을 도출하는 방법을 연구하는 것이다. 그 형식으로는 모수추정(母數推定)·가설검정·구간추정(區間推定) 등의 방법론이 있다. 모수추정론은 미지모수에 대한 평균오차를 최대로 작게 하는 추정방식을 구하는 방법이다. 가설검정론은 모수에 대한 일정한 가설을 데이터에 의해 검증하는 방법이며, 구간추정론은 모수의 값이 거의 확실히 포함되었다고 생각되는 범위를 구하는 것이 목적이다. 통계데이터의 작성법을 다루는 분야에는 표본조사법과 실험계획법이 있으며, 이들은 모두 확률론 적용을 전제로 한다. 표본조사법은 관찰대상인 모집단의 특성값을 그 집단의 일부(표본)만을 추출하여 관찰한 결과로 추정하는 방법이다. 이 경우 표본집단을 선출하는 방법으로 무작위 추출법인 랜덤샘플링법이 흔히 쓰인다. 표본조사법은 관청통계조사, 일반사회조사에서 주로 쓰인다. 실험계획법은 추측값이 여러 가지 이유에서 우연변동을 포함한 조건 아래 실험을 실시하여 결론을 도출하는 방법을 다루는 것이다. 이 경우 우연변동을 확률적인 것으로 하기 위한 랜덤화(또는 확률화), 결론의 오차를 작게 하고 오차 크기의 평가를 위한 반복, 실험조건을 부분적으로 균일화시키기 위한 블럭화 등의 3가지 원칙이 적용된다. 이 방법은 공업·농업·의료 등의 기술적 응용분야에서 이용되고 있다.


응용통계학

숫자데이터를 처리하고 분석하는 통계적 방법은 여러 분야에서 응용되고 있다. 경제학에서는 계량경제학, 경영학의 오퍼레이션스리서치, 생물학에서의 우량품종 선별을 비롯하여 계량심리학·계량사회학·계량정치학 등과 같이 통계적 방법을 기초로 각 분야의 고유 논리와 결합, 각각의 독자적인 통계방법이 형성되어 쓰이고 있다. 

통계학관련 핵심어