Probabilidades e Estatística III-66
| Índice do grupo | Página anterior | Próxima página |
Tópicos: Intervalo de Confiança para Diferença entre Médias com Variâncias Conhecidas | Intervalo de Confiança para Diferença entre Médias com Variâncias Desconhecidas e Iguais |
Estimar diferenças entre parâmetros é um procedimento que pode ser útil quando se deseja comparar populações com alguma semelhança entre si. Exemplos: lotes de uma mesma peça produzidos por linhas ou fornecedores diferentes, resultados de aproveitamento de um mesmo curso ministrado com métodos diferentes, etc.
1) Intervalo de Confiança: Diferença de Médias com σ² Conhecidos
(Topo | Fim pág)
Sejam as amostras:
{X1···Xm} da população X de média μx e desvio-padrão σx
{Y1···Yn} da população Y de média μy e desvio-padrão σy
Da página Probabilidades e Estatística III-62 pode-se deduzir as distribuições para tamanho grande de amostra:
$$\frac{\overline X - \mu_x}{\sigma_x \big/\sqrt m} \sim N(0,1) \\ \frac{\overline Y - \mu_y}{\sigma_y \big/\sqrt n} \sim N(0,1) \tag{1A}$$
Então, a variável abaixo tem a mesma distribuição:
$$\frac{(\overline X-\overline Y) - (\mu_x-\mu_y)}{\sqrt{\sigma_x^2/m+\sigma_y^2/n}} \sim N(0,1) \tag{1B}$$
É usada, com adaptação, a mesma fórmula da média com desvio-padrão conhecido, dada na página mencionada, para o intervalo de confiança da diferença de médias:
$$P[ \ell_1 \leq (\mu_x - \mu_y) \leq \ell_2 ] = 1 - \alpha \tag{1C}$$
Os limites inferior e superior dados por:
$$\ell_1 = (\overline X - \overline Y) - z_{\alpha/2} \sqrt{\sigma_x^2/m+\sigma_y^2/n} \\ \ell_1 = (\overline X - \overline Y) + z_{\alpha/2} \sqrt{\sigma_x^2/m+\sigma_y^2/n} \tag{1D}$$
Exemplo I-1: suponha que os salários anuais de duas categorias profissionais A e B sejam dados pelas amostras a seguir.
Categoria A: 100 pessoas, salário médio 35000/ano, σ da população 2000
Categoria B: 400 pessoas, salário médio 40000/ano, σ da população 1500
Determinar um intervalo de confiança de 95% para a diferença entre os salários médios dessas categorias.
Solução: considerando A e B as populações X e Y das fórmulas anteriores, m = 100, μx = 35000, σx = 2000, n = 400, μy = 40000, σy = 1500.
Para coeficiente de confiança 95%, tem-se 1 − α = 0,95 ou α = 0,05. Na Tabela desta Página para a distribuição normal padrão, deve-se procurar, conforme visto em páginas anteriores, z para (0,5 − α/2) = 0,475 (isso ocorre porque a tabela dá a área de 0 a z e não à direita de z). Então, zα/2 = 1,96. Usando agora as fórmulas (1D),
ℓ1 = (35000 − 40000) − 1,96 √[ (20002/100) + (15002/400) ] ≈ − 5419
ℓ2 = (35000 − 40000) + 1,96 √[ (20002/100) + (15002/400) ] ≈ − 4581
Portanto, − 5419 ≤ (μx − μy) ≤ − 4581 para nível de confiança 95%.
2) Intervalo de Confiança: Diferença de Médias com σ² Desconhecidos e Iguais
(Topo | Fim pág)
Sejam as amostras:
{X1···Xm} da população X de média μx e desvio-padrão σ
{Y1···Yn} da população Y de média μy e desvio-padrão σ
É possível demonstrar esta relação:
$$V = \frac{\dfrac{(\overline X - \overline Y)-(\mu_x - \mu_y)}{\sqrt{1/m + 1/n}}}{\sqrt {\dfrac{(m-1)s_x^2 + (n-1) s_y^2}{m+n-2}}} \sim t(m+n-2) \tag{2A}$$
Ou seja, a variável V tem Distribuição t-student com (m + n − 2) graus de liberdade. E, adotando método similar ao dos tópicos anteriores, pode-se concluir que os limites de um intervalo de confiança para a diferença (μx − μy) com coeficiente de confiança (1 − α) são dados por:
$$\ell_1 = (\overline X-\overline Y) - t_{\alpha/2,m+n-2} \sqrt {\dfrac{(m-1)s_x^2 + (n-1) s_y^2}{m+n-2}} \sqrt{1/m + 1/n} \tag{2B}$$
$$\ell_1 = (\overline X-\overline Y) + t_{\alpha/2,m+n-2} \sqrt {\dfrac{(m-1)s_x^2 + (n-1) s_y^2}{m+n-2}} \sqrt{1/m + 1/n} \tag{2C}$$
Portanto,
$$P[ \ell_1 \leq (\mu_x - \mu_y) \leq \ell_2 ] = 1 - \alpha \tag{2D}$$
Exemplo II-1: um processo industrial usa uma ferramenta fabricada de aço tipo A, da qual uma amostra de 10 unidades apresentou vida média de 1400 h e desvio-padrão de 120 h. A mesma ferramenta passou a ser fabricada com aço tipo B e um lote de 20 unidades apresentou vida média de 1200 h e desvio-padrão de 100 h. Desde que o processo de fabricação da ferramenta não mudou, pode-se supor idênticos os desvios-padrão das populações de cada amostra. Determinar o intervalo de confiança a 95% para a diferença entre as médias das populações de ambos os tipos de ferramenta.
Tem-se 1 − α = 0,95 ou α = 0,05 ou α/2 = 0,025. Considerando A e B as populações X e Y das fórmulas anteriores,
m = 10, $\overline X$ = 1400, sx = 120, n = 20, $\overline Y$ = 1200, sy = 100. Portanto, m + n − 2 = 28. Segundo a Tabela da Distribuição t-student deste site, para ν = 28 e A = 0,025, t = 2,048.
Calculam-se agora os limites:
ℓ1 = (1400 − 1200) − 2,048 √{ [ (10 − 1)1202 + (20 − 1)1002 ] / (10 + 20 − 2) } √(1/10 + 1/20) ≈ 115,32
ℓ2 = (1400 − 1200) + 2,048 √{ [ (10 − 1)1202 + (20 − 1)1002 ] / (10 + 20 − 2) } √(1/10 + 1/20) ≈ 284,68
Assim, 115,32 ≤ (μx − μy) ≤ 284,68 para coeficiente de confiança 95%.
Referências
APOSTOL, Tom M. Calculus. USA: Blaisdell, 1969.
GRINSTEAD, Charles M. SNELL, J. Laurie. Introduction to Probability.
NIST/SEMATECH e-Handbook of Statistical Methods. http://www.itl.nist.gov/div898/handbook/.
VYGODSKY, M. Mathematical Handbook. Moscow: Mir Publishers, 1971.
|
Topo | Rev: Mar/2018