본문 바로가기
정보통계학[2-1]/국가통계의이해

국가통계의 이해 요점 정리

by boolean 2019. 5. 17.
728x90

지정통계 : 응답의 의무가 있으며, 무응답시 과태료가 부과(예:인구주택총조사, 경제총조사)

일반통계 : 지정통계 외 국가승인통계


확률 표본추출법 :

단순임의 추출법 - 적절한 표본 크기 결정 >일련번호부여 >난수표이용 랜덤하게 표본 추출

층화추출법 - 일정기준으로 2개이상 충으로 구분 > 각 층에 독립적으로 무작위 표본 추출

계통 추출법 - 최초 표본 랜덤으로 무작위 추출 , 나머지 K간격으로 추출

군집 추출법 - 군집으로 형성후 군집 표본을 생성하여 군잡 모두 또는 일부 추출


비확률 표본 추출방법 : 

판단 추출법 - 조사원의 지식과 경험으로 대표표본  판단 추출

할당 추출법 - 각 특성에 따라 층별 크기에 비례하는 표본 배분 추출

편의 추출법 - 조사원 마음대로 표본 선정 추출

눈덩이 추출법 - 눈덩이를 굴리면 커지는 것처럼 소수의 응답자를 찾은 다음 비슷한 사람 소개 추출


확률표본 추출법 

비확률 표본 추출법 

연구 대상이 표본으로 추출될 확률이 알려저 있을 때 용이 

연구 대상이 표본으로 추출될 확률이 알려저 있지 않을 때 용이 

무작위 표본 추출 

작위적 표본추출 

모수추정에 편의가 없음 

모수추정에 편의가 있음 

표본오차 측정이 가능 

표본오차 측정이 불가능 

시간과 비용이 많이 듬 

시간과 비용이 적게 듬 

일반화 가능 

일반화 재약 



표본오차 - 설문지 응답자를 뽑는 과정에서 모집단을 대표하지 않을 사람들을 뽑음으로써 발생하는 오차


비표본오차 - 조사진행과정에서 조사방법 차이, 설문문안 모호성, 감정적인 단어사용, 질문 제시순서, 면접시간 길이, 면접시 제 3자 동석여부, ..... 조사결과 분석 해석  실수 


인구 동태통계 :

일정 기간에 매달 인구동태를 조사하고 작성주기는 매년으로 한다. 

조사대상은 대한민국 영토 내 혹은 외국에 거주하는 모든 국민으로써 출생·사망·혼인·이혼신고를 한 자이고, 조사방법은 출생·사망·혼인·이혼 등의 사건이 발생할 때마다 신고의무자가 법정신고 기한 내에 해당 신고서를 작성하여 시·구 또는 읍·면·동사무소에 제출하면 이를 근거로 해당기관 공무원이 인구동태조사 항목을 PC를 이용하여 ‘인구동태 신고시스템’에 입력한다. 


출산력 : 한 인구집단의 출생수준을 말하는 것이다.

조출생률 : 가장 기분적인 출산력 지표

$\frac{연간 총출생아수}{연앙인구} \times 1000$

일반 출생률 : 조출생률에 비해 정교한 자료임

$\frac{연간 총출생아수}{15 ~49 세의 여자인구} \times 1000$

연령별 출산율 : 연령 계층별 출산력 수준을 나타냄

$ASFR = \frac{모의 연령별  출생아수}{해당 연령별 여자인구} \times 1000$

합계출산률 : 한 여자가 평생 낳는 아이수

${\LARGE\Sigma}_{a=15}^{49} \frac{ASFR}{1000}$



인구 정태통계 :

어느 특정한 시점에서 파악한 인구의 상태로서 이는 흔히 인구조사 센서스에 의해 조사되고 있다. 이것은 제1차적·기본적인 인구자료이기 때문에 근대국가는 나라 전체에 걸쳐 이를 정기적으로 실시하고 있다.


인구정태통계는 일반적으로는 인구조사로 파악되나 인구동태통계의 결과를 사용하여 거기에 출생수·전입수(轉入數)를 가산하고 사망수(死亡數)·전출수(轉出數)를 감하여 총인구를 추계(推計)할 수도 있다. 또한 어떤 시점의 총인구를 알고 있을 경우에는 그 이전의 어떤 시점의 총인구를 출생률·사망률 등의 동향에서 추계할 수도 있다. 



기대수명 : 0세의 출생아가 앞으로 생존할 것으로 기대되는 평균생존연수(0세의 기대여명)


기대여명 : 연령 x세의 사람이 앞으로 생존할 것으로 기대되는 평균 생존연수


  ※ 평균수명 = 기대수명 = 출생시 기대여명


연앙인구 : 출생률과 사망률을 산출할 때 한 해의 중간인 7월1일을 기준으로 하여 산출한 인구를 말한다.

당해년 평균인구


순재생산율 : 재 생산율에서 출생한 여아의 사망력을 감안한것


조사망율 : 주어진 기간의 사망률 / 동일 기간의 평균 인구 * 1000


유병기간 제외 기대수명(건강수명): 기대수명 중 질병이나 부상으로 고통받은 기간을 제외한 건강한 삶을 유지한 기간을 의미


  ※ 건강수명은 유병기간 제외 기대수명, 주관적 건강평가 기대수명으로 작성되며, 여기서는 유병기간 제외 기대수명만 수록


경제활동인구조사 :

만 15세 이상 인구를 대상으로 조사한다.

구분 -   취업자 : 조사대상주간에 1시간이상 근무, 

실업자 : 노동쟁의자, 

비경제활동인구 : 주부, 학생, 구직 단념자

내용 - 산업별 이직율, 취업인구비율, 경제활동참가율, 고용율, 실업율

표본가구에 대해 매월 조사

사업체조사 :

사업체노동력조사

일정규모 이상의 사업체 대상 조사

표본조사

전체 취업자 구조를 파악하지 못한다.


경제활동 참가율 계산 :


$\frac{경제활동인구(취업자 + 실업자)}{15세 이상 인구}\times 100 = 경제활동 참가율$


실업율 계산 :


$\frac{실업자}{경제활동인구(취업자 + 실업자)}\times 100 = 실업율$


고용율 계산 :


$\frac{취업자 }{15세 이상 인구}\times 100 = 고용율$


소비자 물가지수 계산 :

1. 지수를 산출할 표준 조사품목 지정

   ex) 사과 4개, 배 2개

2. 조사품목 가격 파악 

년도 

사과 

배 

2000년 

10원 

20원 

2001년 

20원 

30원 

2002년 

30원 

40원 

3. 년도별 실질 가격의 변화 계산

년도 

사과 

배 

합계

2000년 

10 * 4 = 40 

20 * 2 = 40 

80

2001년 

20 * 4 = 80 

30 * 2 = 60 

140

2002년 

30 * 4 = 120 

40 * 2 = 80 

200


4. 기준년도 설정 및 기준년도 대비 소비자 물가지수 산출

2000년 

(80 / 80) * 100 = 100 

2001년 

(140 / 80) * 100 = 175 

2002년 

(200 / 80) * 100 = 250 


소비자물가 상승률 계산 : 소비자 물가의 전년(기준년도)대비 상승률


$\frac{당해년도 소비자물가지수 - 기준년도 소비자물가지수}{기준년도 소비자물가지수}\times 100 = (\frac{당해년도 소비자물가지수}{기준년도 소비자물가지수} - 1) \times 100 = 소비자물가 상승률$



명목임금 상승률 계산 :  명시된 임금의 전년(기준년도)대비 상승률


$\frac{당해년도 임금 - 기준년도 임금}{기준년도 임금}\times 100 = (\frac{당해년도 임금}{기준년도 임금} - 1) \times 100 = 명목임금 상승률$




실질 임금 계산 : 소비자 물가지술를 반영한 실제의 임금


$\frac{명목 임금}{소비자 물가지수}\times 100 = 실질 임금$


실질임금 상승률 계산 : 실질 임금의 전년(기준년도)대비 상승률


$\frac{당해년도 실질임금 - 기준년도 실질임금}{기준년도 실질임금}\times 100 = (\frac{당해년도 실질임금}{기준년도 실질임금} - 1) \times 100 = 실질임금 상승률$


국내총생산 : 영토의 개념을 바탕으로 측정


명목 GDP:

 생산의 가치를 당해년도 가격으로 (계산시의 가격만으로) 계산한 것을 말한다. 경상가격 GDP라고도 한다. 만약 물가가 오르면 생산물의 가격이 오르기 때문에 실제 총 생산량은 변하지 않더라도 명목 GDP는 오른다. 1인당 국민소득 등과 같이 경제의 절대 규모를 측정할 때 쓰이는 GDP다.


실질 GDP:

 생산의 가치를 기준년도 가격(불변가격)으로 계산한 것을 말한다. 불변 가격 GDP라고 한다. 특정 해를 기준연도로 정해놓고, 현재 연도의 생산량에 기준연도의 가격(=과거의 가격)을 곱해서 GDP를 계산한 것이다. 따라서 물가 인상으로 인한 GDP 상승분이 제거되므로 실질적인 생산량의 변화만이 반영된다. 과거 대비 경제 비교, 경제성장률을 지칭할 때는 이 GDP가 쓰인다.

지수의 기초이론

통계비례수 : 통계수치를 비교하여 상대적 관계를 나타내는 숫자

지수, 구성비, 비율


개별지수 : 한 종류의 통계계열을 측정단위가 없는 상대적 수치인 지수로 바꾼것


취업자수(천 명) 

23829 

24244 

24681 

25066 

25599 

고정기준지수

(2010년 = 100) 

100.0 

101.7 

103.6 

105.2 

107.4 

연환지수

(전년도 = 100) 

101.7 

101.8 

101.6 

102.1 

 

2010년 

2011년 

2012년 

2013년 

2014년 


고정기준지수 : 지수를 산출할 때 기준시점을 한시점에 고정시켜 개별지수를 산출

연환지수 : 지수를 산출할 때 기준시점을 비교시점의 직전 시점으로 한 것


종합지수 : 개별 품목의 변동을 종합하여 전체적인 변동을 알기위해 대상품목 전체를 종합한 지수


금액지수 : 공통적인 측정 단위인 금액으로 바꾸어 금액을 지수화 한 것


$2013년 생산액지수 = \frac{2013년 생산액}{2010년 생산액} \times  100 = \frac{(2013년 수량 \times 2013년 가격)합계}{(2010년 수량 \times 2010년 가격)합계} \times 100$


$= \frac{{\LARGE\Sigma} Q_{13}P_{13}}{{\LARGE\Sigma} Q_{10}P_{10}} \times  100$


$= \frac{{\LARGE\Sigma} Q_t P_t}{{\LARGE\Sigma} Q_0 P_0} \times  100 \qquad (단, t: 비교시점, 0: 기준시점) $


수량지수 : 가격의 영향을 받지 않는 수량만의 변동을 나타내기 위해서는 동일한 연도의 가격을 적용해야 한다.


기준시 가격적용 (라스파이레스 산식 수량지수)


$2013년 수량지수 = \frac{(2013년 수량 \times 2010년 가격)합계}{(2010년 수량 \times 2010년 가격)합계} \times 100$

$= \frac{{\LARGE\Sigma} Q_{13}P_{10}}{{\LARGE\Sigma} Q_{10}P_{10}} \times  100$


$= \frac{{\LARGE\Sigma} Q_t P_0}{{\LARGE\Sigma} Q_0 P_0} \times  100$


$= \frac{{\LARGE\Sigma} Q_0 P_0\times\frac{Q_t}{Q_0}}{{\LARGE\Sigma} Q_0 P_0} \times  100$


$= {\huge\Sigma}\frac{W_0 \times \frac{Q_t}{Q_0}}{{\LARGE\Sigma} W_0} \times  100 \qquad (단, t: 비교시점, 0: 기준시점, W_0: 기준시점\: 가중치) $



비교시 가격적용 (파쉐 산식 수량지수)


$2013년 수량지수 = \frac{(2013년 수량 \times 2013년 가격)합계}{(2010년 수량 \times 2013년 가격)합계} \times 100$

$= \frac{{\LARGE\Sigma} Q_{13}P_{13}}{{\LARGE\Sigma} Q_{10}P_{13}} \times  100$


$= \frac{{\LARGE\Sigma} Q_t P_t}{{\LARGE\Sigma} Q_0 P_t} \times  100$


$= \frac{{\LARGE\Sigma} Q_t P_t}{{\LARGE\Sigma} Q_t P_t\times\frac{Q_0}{Q_t}} \times  100$


$= \frac{1}{\frac{{\LARGE\Sigma} Q_t P_t\times\frac{Q_0}{Q_t}}{{\LARGE\Sigma} Q_t P_t}} \times  100$


$= \frac{1}{{\huge\Sigma}\frac{W_t \times \frac{Q_0}{Q_t}}{{\LARGE\Sigma} W_t}} \times  100 \qquad (단, t: 비교시점, 0: 기준시점, W_t: 비교시점\: 가중치) $


물가지수 : 수량의 영향을 받지 않는 물가만의 변동을 나타내기 위해서는 동일한 연도의 수량을 적용해야 한다.


기준시 수량적용 (라스파이레스 산식 물가지수)


$2013년 물가지수 = \frac{(2013년 가격 \times 2010년 수량)합계}{(2010년 가격 \times 2010년 수량)합계} \times 100$

$= \frac{{\LARGE\Sigma} P_{13}Q_{10}}{{\LARGE\Sigma} P_{10}Q_{10}} \times  100$


$= \frac{{\LARGE\Sigma} P_t Q_0}{{\LARGE\Sigma} P_0 Q_0} \times  100$


$= \frac{{\LARGE\Sigma} P_0 Q_0\times\frac{P_t}{P_0}}{{\LARGE\Sigma} P_0 Q_0} \times  100$


$= {\huge\Sigma}\frac{W_0 \times \frac{P_t}{P_0}}{{\LARGE\Sigma} W_0} \times  100 \qquad (단, t: 비교시점, 0: 기준시점, W_0: 기준시점\: 가중치) $



비교시 수량적용 (파쉐 산식 물가지수)


$2013년 물가지수 = \frac{(2013년 수량 \times 2013년 가격)합계}{(2010년 수량 \times 2013년 가격)합계} \times 100$

$= \frac{{\LARGE\Sigma} P_{13}Q_{13}}{{\LARGE\Sigma} P_{10}Q_{13}} \times  100$


$= \frac{{\LARGE\Sigma} P_t Q_t}{{\LARGE\Sigma} P_0 Q_t} \times  100$


$= \frac{{\LARGE\Sigma} P_t Q_t}{{\LARGE\Sigma} P_t Q_t\times\frac{P_0}{P_t}} \times  100$


$= \frac{1}{\frac{{\LARGE\Sigma} P_t Q_t\times\frac{P_0}{P_t}}{{\LARGE\Sigma} P_t Q_t}} \times  100$


$= \frac{1}{{\huge\Sigma}\frac{W_t \times \frac{P_0}{P_t}}{{\LARGE\Sigma} W_t}} \times  100 \qquad (단, t: 비교시점, 0: 기준시점, W_t: 비교시점\: 가중치) $


지수의 바이어스

기준시점이 비교시점과 멀어질수로 지수의 괴리현상이 발생하는데 이것을 바이어스라고 한다. 

라스파이레스 산식은 상향 바이어스가 파쉐 산식은 하향 바이어ㅅ가 나타난다.


연쇄지수

지수의 바이어스 현상을 해결하기 위한 것으로 연쇄라스파이레스지수와 연쇄파쉐지수가 있으며 인접한 두 시점 간의 변화를 나타내는 연환지수를 통해 최근의 가격 및 물량체계의 변화를 반영함 으로써 고정기준밤식에 바해 통계의 현실 반영도를 제고 할수 있으며, 임의의 두 시점간 정확한 가격 및 수량체계의  변화비교가 가능하다.

반면 가격이나 물량의 변동이 주기적으로 되풀이 되는 경우 드리프트 문제가 발생하고, 상위지수가 구성항목의합과 일치하지 않는 비가법성의 문제가 발생한다.


전월비 계산:


$전월비\:=\: \left(\frac{금월지수}{전월지수}\:-\:1\right)\:\times\:100$


전년비 계산:


$전년비\:=\: \left(\frac{금년지수}{전년지수}\:-\:1\right)\:\times\:100$


전년동월비 계산:


$전년동월비\:=\: \left(\frac{금월지수}{전년\: 같은월지수}\:-\:1\right)\:\times\:100$


기여도 계산:


$기여도\:=\: \left(\frac{(비교시점\:품목지수- 기준시첨\: 품목지수)}{기준시점\: 총지수}\times \frac{품목 \:가중치}{전체\:가중치}\:\right)\:\times\:100$



기여율 계산 : 기여도를 백분비로 환산한 것이다.


기여율 (%)

기여도(%포인트) 

 A품목: 300 / 680 = 44.1%

A품목: 44.1 / 100 x 6.4 = 2.8 또는 300/106.0=2.8 

 B품목: 240 / 680 = 35.3%

B품목: 35.3 / 100 x 6.4 = 2.3 또는 240/106.0=2.3 

 C품목: 140 / 680 = 20.6%

C품목: 20.6 / 100 x 6.4 = 1.3 또는 140/106.0=1.3




기여율과 기여도의계산 예시

품목 

가중치

전년지수

$P_1$ 

 금년지수

$P_2$

증감률

$(P_2-P_1)/P_1$ 

 지수차

$P_2-P_1$

지수차

X가중치 

상승

기여율 

기여도 

종합 

100 

106.0 

112.8 

6.0 

6.8 

680 

100.0 

6.4 

A품목 

50 

104.0 

110.0 

5.8 

6.0 

300 

44.1 

2.8 

B품목 

30 

120.0 

128.0 

8.0 

8.0 

240 

35.3 

2.3 

C품목 

20 

90.0 

97.0 

7.0 

7.0 

140 

20.6 

1.3 



디플레이트 : 금액의 변동에서 물가의 변동을 제거하여 순수한 수량만의 변동을 보고자 할 때  사용한다

금액지수를 물가지수로 나누어준다.

이 때 물가지수를 디플레이터 라고 한다.

금액지수를 라스파이레스 물가지수(기준 수럄적용)으로 나누어 산출된는 수량지수는 파쉐 산식이 된다.


$디플레이트 = \frac{금액지수}{디플레이터}\:=\frac{금액지수}{물가지수}\:=\Huge\: \frac{\frac{{\LARGE\Sigma}P_tQ_t}{{\LARGE\Sigma}P_0Q_0}}{\frac{{\LARGE\Sigma}P_tQ_0}{{\LARGE\Sigma}P_0Q_0}}\:=\:\frac{{\LARGE\Sigma}P_tQ_t}{{\LARGE\Sigma}P_tQ_0}$


생산자물가지수: 

기준시점 고정 가중산술평균법(라스파이레스 산식)

한국은행에서 작성

보조지표로 가공단계별 물가지수를 작성한고 있음

지수 작성시 가중치 고려

비교연도가 기준연도에서 멀어지면 지수의 현실반영도가 떨어짐


광공업생산지수 :

경제 전체의 생산활동 움직임을 월별로 판단할 수 있는 지표

경기에 민감하게 움직이며 실질경제의 움직임을 나타내는 지표중 가장 빠른 공표


가동률지수 :

지수채택 업종 및 품목의 부가가치를 기준으로 산출

지수의 산식은 기준시 가중산술평균법(라스파이레스 산식)에 따른다.

품목별로 생산능력 산정이 어려워 지수에 채택되는 품목이 제한된다.


경기변동 :

치킨파동 - 40개월(3~5년)

쥬글라 파동 - 10년 주기 설비투자 내용년수

한센 파동 - 17년 주기

크즈네즈 파동 - 15~ 25년

콘드라 티예프 파동 - 45 ~ 50년


경제모형 : 

거시개량모형 - 설정, 추정, 모의실험의 과정을 거쳐 작성된다.

거시개량모형의 설정과정에서 경제이론에 입각하여 경제변수 간의 관계를 여러 개의 방정식으로 표현하게 된다.

시계열 모형 - 시간의 흐름에 따라 변하는 자료를 토대로 미래의 값을 예측하거나 시계열 데이터의 특성을 파악하기 위함


로렌츠 곡선:

 하위 x%의 가구가 y%의 소득이 분배될 때의 확률 분포를 누적 분포 함수의 그래프로 나타낸 것이다. 로렌츠 곡선은 소득 분배 정도를 나타낼 때 주로 이용된다


지니 계수:

 경제적 불평등(소득 불균형)을 계수화 한 것이다. 오늘날 가장 널리 사용되는, 불평등의 정도를 나타내는 통계학적 지수이다. 서로 다른 로렌츠 곡선들이 교차하는 경우 비교하기가 곤란하다는 로렌츠 곡선의 단점을 보완할 수 있다. 지니 계수는 소득 분배의 불평등함 외에도, 부의 편중이나 에너지 소비에 있어서의 불평등함에도 응용된다.


소득5분위 :

상위 20% 계층의 소득 점유율을 하위 20%  계층의 소득점유율로 나누어 계산한다

댓글