- ๋ฒ ๋ฅด๋์ด ๋ถํฌ
- ์ดํญ ๋ถํฌ
- ์นดํ ๊ณ ๋ฆฌ ๋ถํฌ
- ๋คํญ ๋ถํฌ
- ๊ฐ์ฐ์์ ์ ๊ท ๋ถํฌ
- t ๋ถํฌ
- ์นด์ด์ ๊ณฑ ๋ถํฌ
- F ๋ถํฌ
- ๋ฒ ํ ๋ถํฌ
- ๊ฐ๋ง ๋ถํฌ
์ฐ์ ๋ฒ ๋ฅด๋์ด ์ํ์ด๋ ๊ฒฐ๊ณผ๊ฐ ๋ ๊ฐ์ง ์ค ํ๋๋ง ๋์ค๋ ๊ฒ์ ๋งํ๋ค. ๋ฒ ๋ฅด๋์ด ํ๋ฅ ๋ณ์๋ ์ํ๊ฒฐ๊ณผ๊ฐ
-
pmf
:$Bern(x;\theta) = \theta^x(1-\theta)^{1-x}$ -
expectation
:$E[X] = \theta$ -
variance
:$Var[X] = \theta ( 1-\theta)$
- ํ๋ฅ ๋ถํฌ : ๋ฒ ๋ฅด๋์ด๋ถํฌ, ์ดํญ๋ถํฌ, ์นดํ ๊ณ ๋ฆฌ๋ถํฌ, ๋คํญ๋ถํฌ - Fall in Machine-Learning
- 8.2 ๋ฒ ๋ฅด๋์ด๋ถํฌ์ ์ดํญ๋ถํฌ - ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ค์ฟจ
๋ฒ ๋ฅด๋์ด ์ํ์
-
pmf
:$Bin(x;N, \theta) = \binom{N}{x} \theta^N (1-\theta)^{N-x}$ -
expectation
:$E[X] = N\theta$ -
variance
:$Var[X] = N\theta ( 1-\theta)$
- ํ๋ฅ ๋ถํฌ : ๋ฒ ๋ฅด๋์ด๋ถํฌ, ์ดํญ๋ถํฌ, ์นดํ ๊ณ ๋ฆฌ๋ถํฌ, ๋คํญ๋ถํฌ - Fall in Machine-Learning
- 8.2 ๋ฒ ๋ฅด๋์ด๋ถํฌ์ ์ดํญ๋ถํฌ - ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ค์ฟจ
์นดํ ๊ณ ๋ฆฌ ๋ถํฌ(Categorical distribution)๋ ๋ฒ ๋ฅด๋์ด ๋ถํฌ๋ฅผ ํ์ฅํ ๊ฐ๋ ์ด๋ค. ์ฆ ์นดํ ๊ณ ๋ฆฌ ์ํ(์ฌ๋ฌ๊ฐ์ ์นดํ ๊ณ ๋ฆฌ ์ค ํ๋๋ฅผ ์ ํํ๋ ์คํ)์ ๊ฒฐ๊ณผ๋ ์นดํ ๊ณ ๋ฆฌ ๋ถํฌ๋ฅผ ๋ฐ๋ฅด๊ฒ ๋๋ค. ์นดํ ๊ณ ๋ฆฌ ๋ถํฌ๋ฅผ ๋์ ํ๋ฉด ๋คํญ๋ถํฌ๋ฅผ ์ป๊ฒ ๋๋ค.
์นดํ
๊ณ ๋ฆฌ ํ๋ฅ ๋ณ์๋ one-hot vector๋ก ํํํ ์ ์๋ค. ์๋ฅผ ๋ค์ด, ์ฃผ์ฌ์์ ๊ฒฝ์ฐ
์นดํ
๊ณ ๋ฆฌ๊ฐ
- ์นดํ ๊ณ ๋ฆฌ ๋ถํฌ์ ๋คํญ๋ถํฌ - ๊ณ๋ํฌ์ ์คํ์ค
- ๊ฐ์๋จน๋ ํต๊ณ ๊ธฐ์ด1.ํ๋ฅ ๋ถํฌ ์ ๋ฆฌ - ๊ฐ์๋จน๋ ๋จธ์ ๋ฌ๋
์ฑ๊ณตํ๋ฅ ์ด
๋คํญ๋ถํฌ์ ์์์ ์๋์ ๊ฐ๋ค.
์๋ฅผ๋ค์ด, ์ฃผ์ฌ์๋ฅผ 10๋ฒ ๋์ก์ ๋, 1์ด 1๋ฒ, 2๊ฐ 2๋ฒ, 3์ด 1๋ฒ, 4๊ฐ2๋ฒ, 5๊ฐ 3๋ฒ, 6์ด 1๋ฒ ๋์ค๋ ํ๋ฅ ์ ๊ณ์ฐํ๊ณ ์ ํ๋ค. ์ด๋ฅผ ๋ฒกํฐ๋ก ๋ํ๋ด๋ฉด
$(1, 2, 1, 2, 3, 1)$ ์ด ๋๋ค. 6๋ฒ์ ๋์ก์ ๋$x$ ๋ฒกํฐ์ฒ๋ผ ๋์ฌ ์กฐํฉ์ ๊ณ์ฐํด์ผํ๋ฉฐ, ์์์ ์๋์ ๊ฐ๋ค.
- ์นดํ ๊ณ ๋ฆฌ ๋ถํฌ์ ๋คํญ๋ถํฌ - ๊ณ๋ํฌ์ ์คํ์ค
- ๊ฐ์๋จน๋ ํต๊ณ ๊ธฐ์ด1.ํ๋ฅ ๋ถํฌ ์ ๋ฆฌ - ๊ฐ์๋จน๋ ๋จธ์ ๋ฌ๋
ํ๊ท ์ ์ค์ฌ์ผ๋ก ์ข์ฐ๊ฐ ๋์นญ์ธ ์ข ๋ชจ์์ ๊ทธ๋ฆฌ๋ ์ ๊ท๋ถํฌ์ด๋ค. ์ ๊ท ๋ถํฌ์ ํ๋ฅ ๋ฐ๋ ํจ์์ ๊ทธ ๊ทธ๋ํ๋ ์๋์ ๊ฐ๋ค.
์ ๊ท ๋ถํฌ ์์์ ๋ณ์๋
t ๋ถํฌ๋ ์ ๊ท๋ถํฌ์ ๊ฐ์ด ์ค์ฌ์ ๊ธฐ์ค์ผ๋ก ์ข์ฐ ๋์นญ์ด๊ณ ์ข ๋ชจ์ ํํ๋ฅผ ๊ฐ๊ณ ์ค์ฌ์ 0์ผ๋ก ๊ณ ์ ๋์ด ์๋ ๋ถํฌ์ด๋ค.
์์ ๋(degree of freedom, df)์ ๋ฐ๋ผ ์ข ์ ํํ๊ฐ ์กฐ๊ธ์ฉ ๋ณํํ๋ค.
df๋ ํ๋ณธ์์ ๊ด๋ จ์ด ์๋ ๊ฐ๋ ์ผ๋ก, ํ๋ณธ์ด ๋ง์์ง๋ฉด ํ์ค์ ๊ท๋ถํฌ์ ๊ฑฐ์ ๋์ผํ ํํ๋ฅผ ๋ณด์ธ๋ค.
๊ฐ๋ง ํจ์
- 8.5 ์คํ๋ํธ t๋ถํฌ, ์นด์ด์ ๊ณฑ๋ถํฌ, F๋ถํฌ - ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ค์ฟจ
- 2.4 t-๋ถํฌ(t-distribution, Student's t-distribution) - Must Learning with R
์ ๊ท ๋ถํฌ์ ์ ๊ณฑํฉ์
- 8.5 ์คํ๋ํธ t๋ถํฌ, ์นด์ด์ ๊ณฑ๋ถํฌ, F๋ถํฌ - ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ค์ฟจ
- 2.5 ์นด์ด์ ๊ณฑ ๋ถํฌ์ F๋ถํฌ - Must Learning with R
F ๋ถํฌ๋ ๋
๋ฆฝ์ ์ธ
- 8.5 ์คํ๋ํธ t๋ถํฌ, ์นด์ด์ ๊ณฑ๋ถํฌ, F๋ถํฌ - ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ค์ฟจ
- 2.5 ์นด์ด์ ๊ณฑ ๋ถํฌ์ F๋ถํฌ - Must Learning with R
๊ฐ๋ง ๋ถํฌ๋ ๊ฐ๋ง ํจ์๋ฅผ ์ฌ์ฉํ์ฌ ์ ์ฒด k๋ฒ์ ์ฌ๊ฑด์ด ์ผ์ด๋ ๋๊น์ง ๊ฑธ๋ฆฌ๋ ์๊ฐ์ ๋ํ๋ด๋ ์ฐ์ ํ๋ฅ ๋ถํฌ์ด๋ค.
๊ฐ๋ง ๋ถํฌ๋
๊ฐ๋ง ํจ์
ํฉํ ๋ฆฌ์ผ์ ํจ์๋ก ์ผ๋ฐํํ ๊ฒ
- ๊ฐ์๋จน๋ ํต๊ณ ๊ธฐ์ด [1] ํ๋ฅ ๋ถํฌ ์ ๋ฆฌ - ๊ฐ์๋จน๋ ๋จธ์ ๋ฌ๋
- 8.7 ๋ฒ ํ๋ถํฌ, ๊ฐ๋ง๋ถํฌ, ๋๋ฆฌํด๋ ๋ถํฌ - datascience school
๋ฒ ํ ๋ถํฌ๋ ๋ ๋ชจ์
๋ฒ ํ ํจ์๋ ์ดํญ ๊ณ์(์กฐํฉ, combination ์ผ๋ก๋ ๋ถ๋ฆผ) ๋ฅผ ๋ํ๋ด๋ ํจ์์ธ๋ฐ, ์ดํญ ๊ณ์๋ ํฉํ ๋ฆฌ์ผ๋ก ์ด๋ฃจ์ด์ ธ์๊ธฐ ๋๋ฌธ์ ๋ฒ ํ ํจ์๋ ๊ฐ๋ง ํจ์๋ก ๋ํ๋ผ ์ ์๋ค.
๋ฒ ํ ๋ถํฌ์ ๊ฐ์