Anotações & Informações | Fim pág | Voltar |


Probabilidades e Estatística VI-00: Análise de Variância

| Índice do grupo | Página anterior | Próxima página |

Tópicos: Introdução e Exemplo |


1) Introdução e Exemplo

(Topo | Fim pág)

Basicamente, o método consiste em dividir a variação dos dados em uma porção devida a erros aleatórios e uma porção devida a mudança de valores da variável independente.

A variância de uma amostra de n elementos é dada por:

$$s^2 = \sum \frac{(y_i - \overline{y})^2}{n - 1} \tag{1A}$$
Omitindo o procedimento matemático, a fórmula anterior pode ser reescrita para:

$$s^2 = \frac{\sum y_i^2 - (\sum y_i)^2 \big/n}{n - 1} \tag{1B}$$
São comuns as designações para os termos dessa igualdade:

$\sum y_i^2$ Soma dos quadrados $\mathrm{(1C)}$
$(\sum y_i)^2\big/n$ Correção para a média $\mathrm{(1D)}$
$\sum y_i^2 - (\sum y_i)^2 \big/n$ Soma dos quadrados corrigida. Símbolo inglês usual SStotal $\mathrm{(1E)}$
$n - 1$ Graus de liberdade $\mathrm{(1F)}$

Nesta análise, é empregado o conceito de tratamento, que pode ser definido como uma combinação específica de fatores cujos efeitos podem ser comparados com outros tratamentos. Exemplo: se, em uma indústria, uma mesma peça é produzida por máquinas diferentes, cada máquina pode ser considerada um tratamento.

A igualdade a seguir indica a relação entre a resposta e o tratamento para uma análise de variância de uma variável.

$$Y_{ij} = \mu + \tau_i + \epsilon_{ij} \tag{1G}$$
Onde:

Yij Observação de ordem j do tratamento de ordem i
μ Efeito comum de todo o experimento
τi Efeito do tratamento de ordem i
εij Erro aleatório da observação de ordem j do tratamento de ordem i. Supostamente, esses erros são independentes e têm distribuição normal de média nula e determinada variância σ2

Para a formulação do método, são considerados:

I: número de tratamentos $$1 \leq i \leq I \tag{1H}$$
J: número de observações para cada tratamento $$1 \leq j \leq J \tag{1I}$$
C: correção para a média. Ver (1D) $$(\sum y_{ij})^2\big/(IJ) \tag{1J}$$

A soma dos quadrados é dividida em parcelas em conformidade com (1G), considerando que μ é fixo:

$$SS_{total} = SS_{trat} + SS_{err} \tag{1K}$$
Onde,

$$SS_{total} = \sum \sum y_{ij}^2 - C \tag{1L}$$
$$SS_{trat} = (1/J) \sum y_i^2 - C \tag{1M}$$
A soma dos quadrados dos erros (SSerr, também denominada resíduo) é calculada a partir de (1K).

De acordo com (1B), a soma dos quadrados dividida pelo grau de liberdade resulta na variância ou quadrado médio (sigla inglesa MS). E o método pode ser resumido pela tabela a seguir.

Tabela 01
Variação Soma dos quadrados Graus de liberdade Quadrado médio Estatística
Tratamento SStrat I − 1 MStrat = SStrat/(I − 1) F = MStrat/MSerr
Erro SSerr IJ − I MSerr = SSerr/(IJ − I)
Total SStotal IJ − 1

As hipóteses nula e alternativa são:

$$H_0: \tau_1 = \tau_2 = \cdots =\tau_I = 0 \tag{1N}$$
$$H_1: \text{existe pelo menos um i tal que } \tau_i \neq 0 \tag{1O}$$

Considerando um nível de significância α, a hipótese nula é rejeitada se, calculando conforme Tabela 01,

$$F > f_{\alpha \ I-1 \ IJ-1} \tag{1P}$$
Onde fα I−1 IJ−I é o valor da distribuição F para área à direita α e (I−1) (IJ−I) graus de liberdade.

Exemplo: em uma hipotética indústria, as linhas 1, 2, 3 e 4 da Tabela 02 indicam máquinas distintas que fazem uma mesma operação para um mesmo tipo de peça. As colunas de 1 a 8 são peças produzidas e os os valores abaixo são as deformações observadas em uma determinada dimensão da peça. Verificar se há relação entre as máquinas e as deformações com nível de significância de 1%.

Tabela 02
↓i   j→ 1 2 3 4 5 6 7 8 Σj yij j yij)2 Σj yij2
1 0,23 0,16 0,22 0,19 0,15 0,23 0,27 0,21 1,64 2,70 0,35
2 0,44 0,58 0,49 0,53 0,57 0,62 0,50 0,48 4,22 17,79 2,25
3 0,19 0,14 0,24 0,25 0,18 0,23 0,22 0,27 1,72 2,97 0,38
4 0,34 0,37 0,35 0,18 0,28 0,20 0,17 0,24 2,12 4,51 0,61
9,71 27,97 3,59

As quantidades de tratamentos e experimentos são I = 4 e J = 8. Segundo (1J),

C = (Σ yij)2/(IJ) = 9,712 / (4 8) ≈ 2,946

Segundo (1L),

SStotal = ΣΣ yij2 − C = 3,59 − 2,946 = 0,644

Conforme (1M),

SStrat = (1/J) Σ yi2 − C = 27,97/8 − 2,946 ≈ 0,55

Conforme (1K),

SSerr = SStotal − SStrat = 0,644 − 0,55 = 0,094

Segundo Tabela 01,

MStrat = SStrat/(I − 1) = 0,55 / 3 ≈ 0,183

MSerr = SSerr/(IJ − I) = 0,094 / 28 ≈ 0,0033

F = MStrat/MSerr = 0,183 / 0,0033 ≈ 55,5


Conforme tabela da Distribuição F, f1% 3 28 ≈ 4,568. A hipótese nula é, portanto, rejeitada e há pelo menos um tratamento (máquina, no caso) significativo para 1% de significância.
Referências
APOSTOL, Tom M. Calculus. USA: Blaisdell, 1969.
GRINSTEAD, Charles M. SNELL, J. Laurie. Introduction to Probability.
NIST/SEMATECH e-Handbook of Statistical Methods. http://www.itl.nist.gov/div898/handbook/.
VYGODSKY, M. Mathematical Handbook. Moscow: Mir Publishers, 1971.

Topo | Rev: Mar/2008