Intervalo de confiança para diferença entre proporções
| Topo pág | Fim pág |
Sejam as amostras:
X1 ... Xm da população X cujos valores são 0 ou 1.
Y1 ... Yn da população Y cujos valores são 0 ou 1.
Na página
Probabilidades e estatística III-64 foi dado que as médias (
X ou
Y) são estimadores das proporções (p
x e p
y) de valores 1 nas populações e intervalos de confiança podem ser calculados para essas proporções.
A dedução da fórmula para a diferença (p
x − p
y) é simples e aqui não é feita. O resultado é análogo ao da proporção individual já visto na mesma página:
| ℓ1 = (X − Y) − zα/2 √[ |
X(1 − X) |
+ |
Y(1 − Y) |
] |
#A.1# |
| m |
n |
| ℓ2 = (X − Y) + zα/2 √[ |
X(1 − X) |
+ |
Y(1 − Y) |
] |
#A.2# |
| m |
n |
P[ ℓ1 ≤ (px − py) ≤ ℓ2 ] = 1 − α #A.3#.
Onde:
- ℓ1, ℓ2
- : limites inferior e superior do intervalo de confiança.
- X, Y
- : médias das amostras.
- zα/2
- : valor de z da distribuição normal padrão para área à direita α/2.
- m, n
- : números de elementos das amostras.
- px, py
- : proporções (desconhecidas) das populações.
- 1 − α
- : coeficiente de confiança desejado (ex: um valor comum é 95% e, portanto, α = 0,05).
Obs: os resultados são aproximados, válidos para tamanhos grandes de amostras.
Exemplo 01: da população de uma região foram pesquisadas amostras de 300 homens e 400 mulheres sobre a preferência da compra de um certo produto pela Internet. 75 homens e 90 mulheres disseram preferir comprar pela Internet a ir às lojas. Determinar o intervalo de confiança a 95% para a diferença entre as proporções.
Supõe-se que as populações X e Y das fórmulas anteriores correspondem, respectivamente, às populações de homens e mulheres do exemplo. Portanto, m = 300, n = 400, 1 − α = 0,95 ou α = 0,05.
X = 75 / 300 = 0,25. Também
Y = 90 / 400 = 0,225.
Na
tabela desta página para a distribuição normal padrão, deve-se procurar, conforme visto na página anterior, z para (0,5 − α/2) = 0,475 (isso ocorre porque a tabela dá a área de 0 a z e não à direita de z). Então, z
α/2 = 1,96.
Calculando segundo #A.1# e #A.2#, ℓ
1 ≈ −0,039 e ℓ
2 ≈ 0,089. Portanto, a diferença entre as preferências de homens e mulheres pode variar de aproximadamente −3,9% a +8,9% com coeficiente de confiança de 95%.
Intervalo de confiança para a variância da população
| Topo pág | Fim pág |
Segundo tópico
Distribuição chi-quadrado, igualdade #H3#, a relação de uma distribuição normal
(n − 1) s2 / σ2 #A.1# tem distribuição chi-quadrado com
n − 1 graus de liberdade ou
~χ2n − 1.
Considerando
1 − α o coeficiente de confiança e usando método similar aos dos tópicos anteriores sobre intervalos,
| P[ χ2(1 − α/2)(n − 1) ≤ |
(n − 1) s2 |
≤ χ2(α/2)(n − 1) ] = 1 − α |
| σ2 |
Reagrupando a igualdade acima, chega-se a:
| ℓ1 = |
(n − 1) s2 |
|
#B.1# |
| χ2(α/2)(n − 1) |
| ℓ2 = |
(n − 1) s2 |
|
#B.2# |
| χ2(1 − α/2)(n − 1) |
P[ ℓ1 ≤ σ2 ≤ ℓ2 ] = 1 − α #B.3#.
- ℓ1
- : limite inferior do intervalo de confiança.
- ℓ2
- : limite superior do intervalo de confiança.
- n
- : número de elementos da amostra.
- s
- : desvio-padrão da amostra (ver Probabilidades e estatística III-10).
- χ2(α/2)(n − 1)
- : valor da variável aleatória de distribuição χ2 com n − 1 graus de liberdade para área á direita igual a α/2.
- χ2(1 − α/2)(n − 1)
- : idem para (1 − α/2). Lembrar que a distribuição chi-quadrado não é simétrica.
- σ2
- : variância da população, presumivelmente desconhecida.
- 1 − α
- : coeficiente de confiança desejado (ex: um valor comum é 95% e, portanto, α = 0,05).
Exemplo 01: uma amostra de 25 elementos de uma população de distribuição normal apresenta média 7,01 e desvio-padrão 3,74. Determinar um intervalo de confiança a 95% para a variância populacional.
São dados:
n = 25 ou n − 1 = 24.
s = 3,74 ou s² ≈ 13,99.
1 − α = 0,95 ou α = 0,05 ou α/2 = 0,025 ou 1 − α/2 = 0,975.
Segundo a
tabela para a distribuição chi-quadrado deste site, obtêm-se os valores:
χ
2(α/2)(n − 1) = χ
2(0,025)(24) = 39,364. Também χ
2(1 − α/2)(n − 1) = χ
2(0,975)(24) = 12,401.
Conforme #B.1# e #B.2#, ℓ
1 = 24 13,99 / 39,364 ≈ 8,53 e ℓ
2 = 24 13,99 / 12,401 ≈ 27,08.
Portanto, 8,53 ≤ σ
2 ≤ 27,08 para confiança 95%.
Topo |
Índice do grupo |
Página anterior |
Próxima página |
Última revisão ou atualização: Abr/2008
Referências:
NIST/SEMATECH e-Handbook of Statistical Methods. http://www.itl.nist.gov/div898/handbook/.
|
WOLFRAM MATHWORLD. http://mathworld.wolfram.com/.
|