Anotações & Informações | Fim pág | Voltar |


Probabilidades e Estatística III-66

| Índice do grupo | Página anterior | Próxima página |

Tópicos: Intervalo de Confiança para Diferença entre Médias com Variâncias Conhecidas | Intervalo de Confiança para Diferença entre Médias com Variâncias Desconhecidas e Iguais |

Estimar diferenças entre parâmetros é um procedimento que pode ser útil quando se deseja comparar populações com alguma semelhança entre si. Exemplos: lotes de uma mesma peça produzidos por linhas ou fornecedores diferentes, resultados de aproveitamento de um mesmo curso ministrado com métodos diferentes, etc.


1) Intervalo de Confiança: Diferença de Médias com σ² Conhecidos

(Topo | Fim pág)

Sejam as amostras:

{X1···Xm} da população X de média μx e desvio-padrão σx
{Y1···Yn} da população Y de média μy e desvio-padrão σy

Da página Probabilidades e Estatística III-62 pode-se deduzir as distribuições para tamanho grande de amostra:

$$\frac{\overline X - \mu_x}{\sigma_x \big/\sqrt m} \sim N(0,1) \\ \frac{\overline Y - \mu_y}{\sigma_y \big/\sqrt n} \sim N(0,1) \tag{1A}$$
Então, a variável abaixo tem a mesma distribuição:

$$\frac{(\overline X-\overline Y) - (\mu_x-\mu_y)}{\sqrt{\sigma_x^2/m+\sigma_y^2/n}} \sim N(0,1) \tag{1B}$$

É usada, com adaptação, a mesma fórmula da média com desvio-padrão conhecido, dada na página mencionada, para o intervalo de confiança da diferença de médias:

$$P[ \ell_1 \leq (\mu_x - \mu_y) \leq \ell_2 ] = 1 - \alpha \tag{1C}$$
Os limites inferior e superior dados por:

$$\ell_1 = (\overline X - \overline Y) - z_{\alpha/2} \sqrt{\sigma_x^2/m+\sigma_y^2/n} \\ \ell_1 = (\overline X - \overline Y) + z_{\alpha/2} \sqrt{\sigma_x^2/m+\sigma_y^2/n} \tag{1D}$$

Exemplo I-1: suponha que os salários anuais de duas categorias profissionais A e B sejam dados pelas amostras a seguir.

Categoria A: 100 pessoas, salário médio 35000/ano, σ da população 2000
Categoria B: 400 pessoas, salário médio 40000/ano, σ da população 1500

Determinar um intervalo de confiança de 95% para a diferença entre os salários médios dessas categorias.

Solução: considerando A e B as populações X e Y das fórmulas anteriores, m = 100, μx = 35000, σx = 2000, n = 400, μy = 40000, σy = 1500.

Para coeficiente de confiança 95%, tem-se 1 − α = 0,95 ou α = 0,05. Na Tabela desta Página para a distribuição normal padrão, deve-se procurar, conforme visto em páginas anteriores, z para (0,5 − α/2) = 0,475 (isso ocorre porque a tabela dá a área de 0 a z e não à direita de z). Então, zα/2 = 1,96. Usando agora as fórmulas (1D),

1 = (35000 − 40000) − 1,96 √[ (20002/100) + (15002/400) ] ≈ − 5419

2 = (35000 − 40000) + 1,96 √[ (20002/100) + (15002/400) ] ≈ − 4581

Portanto, − 5419 ≤ (μx − μy) ≤ − 4581 para nível de confiança 95%.


2) Intervalo de Confiança: Diferença de Médias com σ² Desconhecidos e Iguais

(Topo | Fim pág)

Sejam as amostras:

{X1···Xm} da população X de média μx e desvio-padrão σ
{Y1···Yn} da população Y de média μy e desvio-padrão σ

É possível demonstrar esta relação:

$$V = \frac{\dfrac{(\overline X - \overline Y)-(\mu_x - \mu_y)}{\sqrt{1/m + 1/n}}}{\sqrt {\dfrac{(m-1)s_x^2 + (n-1) s_y^2}{m+n-2}}} \sim t(m+n-2) \tag{2A}$$

Ou seja, a variável V tem Distribuição t-student com (m + n − 2) graus de liberdade. E, adotando método similar ao dos tópicos anteriores, pode-se concluir que os limites de um intervalo de confiança para a diferença x − μy) com coeficiente de confiança (1 − α) são dados por:

$$\ell_1 = (\overline X-\overline Y) - t_{\alpha/2,m+n-2} \sqrt {\dfrac{(m-1)s_x^2 + (n-1) s_y^2}{m+n-2}} \sqrt{1/m + 1/n} \tag{2B}$$

$$\ell_1 = (\overline X-\overline Y) + t_{\alpha/2,m+n-2} \sqrt {\dfrac{(m-1)s_x^2 + (n-1) s_y^2}{m+n-2}} \sqrt{1/m + 1/n} \tag{2C}$$

Portanto,

$$P[ \ell_1 \leq (\mu_x - \mu_y) \leq \ell_2 ] = 1 - \alpha \tag{2D}$$
Exemplo II-1: um processo industrial usa uma ferramenta fabricada de aço tipo A, da qual uma amostra de 10 unidades apresentou vida média de 1400 h e desvio-padrão de 120 h. A mesma ferramenta passou a ser fabricada com aço tipo B e um lote de 20 unidades apresentou vida média de 1200 h e desvio-padrão de 100 h. Desde que o processo de fabricação da ferramenta não mudou, pode-se supor idênticos os desvios-padrão das populações de cada amostra. Determinar o intervalo de confiança a 95% para a diferença entre as médias das populações de ambos os tipos de ferramenta.

Tem-se 1 − α = 0,95 ou α = 0,05 ou α/2 = 0,025. Considerando A e B as populações X e Y das fórmulas anteriores,

m = 10, $\overline X$ = 1400, sx = 120, n = 20, $\overline Y$ = 1200, sy = 100. Portanto, m + n − 2 = 28. Segundo a Tabela da Distribuição t-student deste site, para ν = 28 e A = 0,025, t = 2,048.

Calculam-se agora os limites:

1 = (1400 − 1200) − 2,048 √{ [ (10 − 1)1202 + (20 − 1)1002 ] / (10 + 20 − 2) } √(1/10 + 1/20) ≈ 115,32

2 = (1400 − 1200) + 2,048 √{ [ (10 − 1)1202 + (20 − 1)1002 ] / (10 + 20 − 2) } √(1/10 + 1/20) ≈ 284,68

Assim, 115,32 ≤ (μx − μy) ≤ 284,68 para coeficiente de confiança 95%.
Referências
APOSTOL, Tom M. Calculus. USA: Blaisdell, 1969.
GRINSTEAD, Charles M. SNELL, J. Laurie. Introduction to Probability.
NIST/SEMATECH e-Handbook of Statistical Methods. http://www.itl.nist.gov/div898/handbook/.
VYGODSKY, M. Mathematical Handbook. Moscow: Mir Publishers, 1971.

Topo | Rev: Mar/2018