Anotações & Informações | Índice | Fim pág | Voltar |


Probabilidades e Estatística III-62

|Índice do grupo | Página anterior | Próxima página |

Tópicos: Intervalos de Confiança - Introdução | Intervalo de Confiança para Média (desvio-padrão conhecido) | Intervalo de Confiança para Média (desvio-padrão desconhecido) |


1) Intervalos de Confiança - Introdução

(Topo | Fim pág)

Em páginas anteriores foram dados alguns exemplos de métodos para estimar parâmetros de uma população a partir de informações de uma amostra. Seja um caso comum: a média de uma amostra é um estimador não polarizado para a média μ da população. Entretanto, a estimativa não dá ideia da proximidade em relação ao valor real μ, ou melhor, da precisão do resultado. Um método usual de especificar a precisão é determinar um intervalo de confiança para o parâmetro da população. Exemplo: pode-se dizer que ℓ1 e ℓ2 são, respectivamente, os limites inferior e superior de um intervalo de confiança de 95% para a média μ.

Um engano conceitual comum é supor que, no exemplo citado, há 95% de probabilidade de a média estar entre os limites ℓ1 e ℓ2. Considerando a população estável, a média é fixa, ou seja, ela só pode estar dentro ou fora de um intervalo e, portanto, esse conceito não é válido. Desde que intervalos de confiança são calculados a partir de amostras, o correto é dizer que, na repetição de amostras dessa população, em 95% dos casos a média μ estará entre os valores calculados ℓ1 e ℓ2.


2) Intervalo de Confiança para Média (desvio-padrão conhecido)

(Topo | Fim pág)

Seja {X1···Xn} uma amostra genérica de uma população com desvio-padrão conhecido σ. Deseja-se determinar um intervalo de confiança para a média μ dessa população.

Considera-se uma variável X igual á soma dos elementos da amostra:

$$X = X_1 + \cdots + X_n \tag{2A}$$
Aplicando o teorema do limite central (ver Distribuição Normal), X tem distribuição N(nμ,nσ2) se n tende para infinito (na prática, pode-se supor n ≥ 20 para razoável aproximação). Portanto,

$$E(X) = n \mu\\ \text{Var}(X) = n \sigma^2 \tag{2B}$$
Consideram-se agora as propriedades da multiplicação da média e da variância por um escalar:

$$E(aX) = a E(X)\\ \text{Var}(aX) = a^2 \text{Var}(X) \tag{2C}$$
A média da amostra é dada por:

$$\overline X = \frac{1}{n} X \tag{2D}$$
Aplicando as propriedades (2C)) à essa média, com substituição dos valores de (2B),

$$E(\overline X) = \frac{1}{n} E(X) = \mu \\ \text{Var}(\overline X) = \frac{1}{n^2} \text{Var}(X) = \frac{\sigma^2}{n} \tag{2E}$$
Portanto, ocorre a distribuição:

$$\overline X \sim N(\mu, \sigma^2/n) \tag{2F}$$
Usando método citado na página já mencionada, pode-se deduzir que a variável Z abaixo tem distribuição normal padrão, N(0, 1):

$$Z = \frac{\overline X - \mu}{\sigma \big/ \sqrt n} \tag{2G}$$
De acordo com a função de densidade da distribuição normal padrão (Figura II-1), pode-se ter dois valores simétricos −zα/2 e +zα/2 tais que:

$$P( -z_{\alpha/2} \leq Z \leq +z_{\alpha/2} ) = 1 - \alpha \tag{2H}$$
Distribuição Normal Padrão
Fig II-1

Obs: dado α, o valor zα/2 pode ser obtido de tabelas da distribuição normal padrão. Na Tabela desta Página, deve-se procurar z para (0,5 − α/2) porque ela se refere à área entre o ponto zero e o valor z. Substituindo Z em (2H) pelo seu valor segundo (2G),

$$P \left( -z_{\alpha/2} \leq \frac{\overline X - \mu}{\sigma \big/ \sqrt n} \leq +z_{\alpha/2} \right) = 1 - \alpha \tag{2I}$$

Reagrupando os termos, chega-se à fórmula para o intervalo de confiança da média μ da população:

$$P \left( \overline X - \frac{z_{\alpha/2}\ \sigma}{\sqrt n} \leq \mu \leq \overline X + \frac{z_{\alpha/2}\ \sigma}{\sqrt n} \right) = P(\ell_1 \leq \mu \leq \ell_2) = 1 - \alpha \tag{2J}$$

Resumindo os parâmetros dessa relação,

$\overline X$ média dos valores da amostra $$=\dfrac{1}{n}(X_1 + \cdots + X_n) \tag{2K}$$
zα/2 valor de z da distribuição normal padrão para área à direita α/2
σ desvio-padrão (supostamente conhecido) da população
n número de elementos da amostra
μ média da população (desconhecida e para a qual se deseja um intervalo de confiança)
1 limite inferior do intervalo de confiança $$= \overline X - \dfrac{z_{\alpha/2}\ \sigma}{\sqrt n} \tag{2L}$$
2 limite superior do intervalo de confiança $$= \overline X + \dfrac{z_{\alpha/2}\ \sigma}{\sqrt n} \tag{2M}$$
1 − α coeficiente de confiança desejado (exemplo: um valor comum é 95% e, portanto, α = 0,05)

Exemplo II-1: supõe-se que a variância do peso das pessoas adultas de sexo masculino de uma determinada região seja 144. Em uma amostra de 36 pessoas, foi encontrada uma média de 63,4 kg. Determinar o intervalo de confiança de 90% para a média dos pesos dessas pessoas.

Solução: os dados disponíveis são:

n = 36
σ² = 144. Portanto, σ = 12
X = 63,4
1 − α = 0,90   ou   α = 0,10

Na tabela desta página para a distribuição normal, deve-se procurar, conforme dito anteriormente:

z para (0,5 − α/2) = 0,45

Esse valor não é exatamente encontrado na tabela mencionada. Ocorrem 0,4495 com z = 1,64 e 0,4505 com z = 1,65. Adota-se então uma interpolação simples com

zα/2 = 1,645

E os limites são:

1 = 63,4 − 1,645 × 12 / 6 = 60,11
2 = 63,4 + 1,645 × 12 / 6 = 66,69

Portanto, o resultado é

60,11 ≤ μ ≤ 66,69 para 90% de confiança.

Se a variância ou o desvio-padrão da população não for conhecido, é possível uma aproximação com o uso, no lugar de σ, do desvio-padrão s calculado para a amostra. Nesse caso, é regra prática usar amostra com tamanho mínimo 30 em vez de 20 conforme anteriormente mencionado.


3) Intervalo de Confiança para Média (desvio-padrão desconhecido)

   (Topo pág | Fim pág)

Se o desvio-padrão da população não é conhecido, em vez da aproximação citada no tópico anterior, deve-se considerar que a variável Z tem distribuição t-student com n − 1 graus de liberdade. Usando o símbolo T no lugar de Z,

$$T = \frac{\overline X - \mu}{s \big/ \sqrt n}\ \sim t(n-1) \tag{3A}$$
Nessa condição, o desvio-padrão da população σ é substituído por s (desvio-padrão da amostra):

$$s^2 = \frac{1}{n-1} \sum (X_i - \overline X)^2 \tag{3B}$$
E a relação para o intervalo de confiança é similar a (2J) do tópico anterior, com a substituição do desvio-padrão e a substituição de zα/2 por tα/2 n−1, cujo valor pode ser encontrado nas tabelas da distribuição.

$$P \left( \overline X - \frac{t_{\alpha/2, n-1}\ s}{\sqrt n} \leq \mu \leq \overline X + \frac{t_{\alpha/2, n-1}\ s}{\sqrt n} \right) = P(\ell_1 \leq \mu \leq \ell_2) = 1 - \alpha \tag{3C}$$

Resumindo os parâmetros em forma de tabela,

$\overline X$ média dos valores da amostra $$=\dfrac{1}{n}(X_1 + \cdots + X_n) \tag{3D}$$
tα/2 n−1 valor de distribuição t para área à direita α/2
s desvio-padrão da amostra
n número de elementos da amostra
μ média da população (desconhecida e para a qual se deseja um intervalo de confiança)
1 limite inferior do intervalo de confiança $$= \overline X - \dfrac{t_{\alpha/2, n-1}\ s}{\sqrt n} \tag{3E}$$
2 limite superior do intervalo de confiança $$= \overline X + \dfrac{t_{\alpha/2, n-1}\ s}{\sqrt n} \tag{3F}$$
1 − α coeficiente de confiança desejado (exemplo: um valor comum é 95% e, portanto, α = 0,05)

Exemplo III-1: seja uma amostra com os valores $n = 25; \overline X = 5; s = 0,5$. Determinar o intervalo de confiança a 95% para a média μ da população.

Solução: 1 − α = 0,05 e, portanto, α/2 = 0,025. Também n − 1 = 24. Da Tabela da Distribuição t-student, obtém-se t0,025 24 = 2,064. Usando (3E) e (3F),

1 = 5 − 2,064 0,5 / √25 = 4,7936
2 = 5 + 2,064 0,5 / √25 = 5,2064

Portanto 4,7936 ≤ μ ≤ 5,2064 para 95% de confiança.
Referências
APOSTOL, Tom M. Calculus. USA: Blaisdell, 1969.
GRINSTEAD, Charles M. SNELL, J. Laurie. Introduction to Probability.
NIST/SEMATECH e-Handbook of Statistical Methods. http://www.itl.nist.gov/div898/handbook/.
VYGODSKY, M. Mathematical Handbook. Moscow: Mir Publishers, 1971.

Topo | Rev: Mar/2018