Anotações & Informações | Índice | Fim pág | Voltar |


Probabilidades e estatística III-68

| Índice do grupo | Página anterior | Próxima página |

Tópicos: Intervalo de Confiança para Diferença entre Proporções | Intervalo de Confiança para a Variância da População |


1) Intervalo de Confiança para Diferença entre Proporções

(Topo | Fim pág)

Sejam as amostras:

{X1···Xm} da população X, cujos valores são 0 ou 1
{Y1···Yn} da população Y, cujos valores são 0 ou 1

Na página Probabilidades e Estatística III-64 foi visto que as médias, $\overline X$ ou $\overline Y$, são estimadores das proporções (px ou py) de valores 1 nas populações e que intervalos de confiança podem ser calculados para essas proporções. A dedução da fórmula para a diferença (px − py) é simples e aqui não é demonstrada. O resultado é análogo ao da proporção individual, dado na mesma página:

$$\ell_1 = (\overline X - \overline Y) - z_{\alpha/2} \sqrt{ \frac{\overline X(1-\overline X)}{m} + \frac{\overline Y(1-\overline Y)}{n} } \tag{1A}$$

$$\ell_2 = (\overline X - \overline Y) + z_{\alpha/2} \sqrt{ \frac{\overline X(1-\overline X)}{m} + \frac{\overline Y(1-\overline Y)}{n} } \tag{1B}$$

$$P[\ell_1 \leq (p_X - p_Y) \leq \ell_2] = 1 - \alpha \tag{1C}$$


1, ℓ2 limites inferior e superior do intervalo de confiança
$\overline X, \overline Y$ médias das amostras
zα/2 valor de z da distribuição normal padrão para área à direita α/2
m, n números de elementos das amostras
px, py proporções (desconhecidas) de valores 1 nas populações
1 − α coeficiente de confiança desejado (ex: um valor comum é 95% e, portanto, α = 0,05)

Obs: os resultados são aproximados, válidos para tamanho grande de amostra.

Exemplo I-1: da população de uma região foram pesquisadas amostras de 300 homens e 400 mulheres sobre a preferência da compra de um certo produto pela Internet. 75 homens e 90 mulheres disseram preferir comprar pela Internet a ir às lojas. Determinar o intervalo de confiança a 95% para a diferença entre as proporções.

Solução: supõe-se que as populações X e Y das fórmulas anteriores correspondem, respectivamente, às populações de homens e mulheres do exemplo. Portanto, m = 300, n = 400, 1 − α = 0,95 ou α = 0,05.

$\overline X = 75 / 300 = 0,25$. Também $\overline Y = 90 / 400 = 0,225$

Na Tabela desta Página para a distribuição normal padrão, deve-se procurar, conforme visto na página anterior, z para (0,5 − α/2) = 0,475 (isso ocorre porque a tabela dá a área de 0 a z e não à direita de z). Então, zα/2 = 1,96. Calculando segundo (1A) e (1B), ℓ1 ≈ −0,039 e ℓ2 ≈ 0,089. Portanto, a diferença entre as preferências de homens e mulheres pode variar de aproximadamente −3,9% a +8,9% com coeficiente de confiança de 95%.


2) Intervalo de Confiança para a Variância da População

(Topo | Fim pág)

Segundo tópico Distribuição chi-quadrado, igualdade (1M), para uma população com distribuição normal, tem-se:

$$Y = \frac{(n-1) s^2}{\sigma^2} \sim \chi_{n-1}^2 \tag{2A}$$
Ou seja, Y tem distribuição chi-quadrado com n − 1 graus de liberdade. Considerando 1 − α o coeficiente de confiança e usando método similar aos dos tópicos anteriores sobre intervalos,

$$P \left[ \chi_{1-\alpha/2, n-1}^2 \leq \frac{(n-1)s^2}{\sigma^2} \leq \chi_{\alpha/2, n-1}^2 \right] = 1 - \alpha \tag{2B}$$

Reagrupando essa relação,

$$\ell_1 = \frac{(n-1)s^2}{\chi_{\alpha/2, n-1}^2} \tag{2C}$$
$$\ell_2 = \frac{(n-1)s^2}{\chi_{1-\alpha/2, n-1}^2} \tag{2D}$$
$$P( \ell_1 \leq \sigma^2 \leq \ell_2) = 1 - \alpha \tag{2E}$$
1 limite inferior do intervalo de confiança
2 limite superior do intervalo de confiança
n número de elementos da amostra
s desvio-padrão da amostra (ver Probabilidades e Estatística III-10)
χ2(α/2)(n − 1) valor da variável aleatória de distribuição χ2 com n − 1 graus de liberdade para área à direita igual a α/2
χ2(1 − α/2)(n − 1) idem para (1 − α/2). Deve-se notar que a distribuição chi-quadrado não é simétrica
σ2 variância da população, presumivelmente desconhecida
1 − α coeficiente de confiança desejado (ex: um valor comum é 95% e, portanto, α = 0,05)

Exemplo II-1: uma amostra de 25 elementos de uma população de distribuição normal apresenta média 7,01 e desvio-padrão 3,74. Determinar um intervalo de confiança a 95% para a variância populacional.

Para a solução, consideram-se os dados informados:

n = 25 ou n − 1 = 24

s = 3,74 ou s² ≈ 13,99

1 − α = 0,95 ou α = 0,05 ou α/2 = 0,025 ou 1 − α/2 = 0,975

Consultando a Tabela para a Distribuição chi-quadrado deste site, obtêm-se os valores:

χ2(α/2)(n − 1) = χ2(0,025)(24) = 39,364. Também χ2(1 − α/2)(n − 1) = χ2(0,975)(24) = 12,401

Conforme (2C) e (2D), ℓ1 = 24 13,99 / 39,364 ≈ 8,53 e ℓ2 = 24 13,99 / 12,401 ≈ 27,08. Portanto, 8,53 ≤ σ2 ≤ 27,08 para confiança 95%
Referências
APOSTOL, Tom M. Calculus. USA: Blaisdell, 1969.
GRINSTEAD, Charles M. SNELL, J. Laurie. Introduction to Probability.
NIST/SEMATECH e-Handbook of Statistical Methods. http://www.itl.nist.gov/div898/handbook/.
VYGODSKY, M. Mathematical Handbook. Moscow: Mir Publishers, 1971.

Topo | Rev: Mar/2018