Medidas de localização
| Topo pág | Fim pág |
São também denominadas
medidas de tendência central. A média é, de longe, o parâmetro mais significativo e mais usado, mas há outros que serão vistos nos próximos itens.
Média
Seja uma amostra de n elementos
x1, x2 ... xn. A
média ou
valor médio é dada por:
| x = |
1 |
∑i=1...n xi |
#A.1# |
| n |
Exemplo: foram tomadas 8 medidas de um determinado comprimento com os resultados abaixo.
| x (mm) |
45,07 |
45,01 |
44,95 |
44,99 |
45,02 |
44,87 |
45,11 |
45,03 |
A média dos valores, calculada segundo #A.1#, é
x = 45,01 mm.
Se os dados estão agrupados em m faixas, cada faixa com valor médio x
i e freqüência relativa r
i, a média do conjunto pode ser calculada por:
x ≈ ∑i=1...m xi ri #A.2#.
Exemplo: a tabela abaixo indica os tempos de duração de um lote de 150 ferramentas usadas por uma máquina. Estão divididas em grupos de acordo com a duração média. Exemplo: 5 ferramentas duraram em média 55 horas, 7 ferramentas duraram em média 65 horas e assim sucessivamente.
| x (h) |
55 |
65 |
75 |
85 |
95 |
105 |
115 |
125 |
135 |
145 |
155 |
| a |
5 |
7 |
10 |
21 |
33 |
32 |
22 |
13 |
2 |
3 |
2 |
| r |
0,03 |
0,05 |
0,07 |
0,14 |
0,22 |
0,21 |
0,15 |
0,09 |
0,01 |
0,02 |
0,01 |
As freqüências relativas estão calculadas na linha r da tabela pela divisão da freqüência absoluta (linha a) pelo total (∑ a). Calculando pela fórmula #A.2#,
x = 99,3 h.
Mediana
Seja uma amostra com n valores
x1, x2 ... xn em ordem crescente. A
mediana m desses elementos é o valor em relação ao qual uma metade dos elementos tem valores menores e a outra metade tem valores maiores. É calculada por:
| m = |
xn/2 + x(n/2)+1 |
|
#B.1#. Para n par. |
| 2 |
m = x(n+1)/2 #B.2#. Para n ímpar.
Exemplos:
• A amostra de valores
{3, 3, 4, 5, 6, 7, 8, 8, 10} tem mediana 6.
• A amostra
{4, 6, 7, 9, 11, 12, 14, 15} tem mediana 10.
Do conceito de percentil, visto na página anterior, pode-se concluir que a mediana equivale ao percentil 50 ou ao segundo quartil ou ao quinto decil.
Moda
É o valor que ocorre com mais freqüência. Usado apenas para análises qualitativas. Não é necessariamente único e pode não existir. A sua determinação é usualmente feita a partir de um histograma. Exemplos:
• A amostra
{3, 4, 9, 11, 12, 15} não tem moda.
• A amostra
{2, 2, 3, 3, 5, 8, 8, 8, 12, 14} tem moda 8.
• A amostra
{3, 4, 4, 4, 5, 5, 8, 8, 8, 12, 14} tem modas 4 e 8.
|
| Figura 01 |
Não há relação matemática entre os parâmetros média, mediana e moda. Mas algumas relações comparativas podem ser observadas de acordo com a geometria da curva da função de densidade.
Uma distribuição simétrica, como (b) da Figura 01, deve ter
média = mediana = moda #C.1#.
Uma distribuição concentrada à esquerda (a da figura) deve ter
moda < mediana < média #C.2#.
E uma concentrada à direita (c da figura) deve ter
média < mediana < moda #C.3#.
Ponto médio
É dado pela média aritmética entre o menor valor e o maior valor. Não é um indicador confiável. Normalmente, só é usado em casos nos quais o comportamento dos valores extremos é importante.
Medidas de dispersão
| Topo pág | Fim pág |
Enquanto as medidas de localização dão idéia do
local da
concentração dos valores de uma amostra, as medidas de dispersão dão indicação da
magnitude dessa concentração ou
dispersão.
Amplitude
É dada pela diferença entre o maior valor e o menor. Portanto, para n valores
x1, x2 ... xn, a amplitude é
A = max(xi) − min(xi) #A.1#.
Desvio médio
É dado pela média dos desvios em relação à média da amostra.
Se x1, x2 ... xn são os valores,
| DM = |
1 |
∑i=1...n (xi − x) |
#B.1# |
| n |
Onde
x é a média calculada conforme tópico anterior.
Se os dados estão agrupados em m faixas e cada faixa tem valor médio x
i e freqüência relativa r
i,
DM ≈ ∑i=1...m (xi − x) ri #B.2#. Onde
x é a média calculada conforme tópico anterior.
Variância
Para uma amostra de n elementos
x1, x2 ... xn, a variância é calculada por:
| s2 |
= |
∑i=1...n (xi − x)2 |
|
#C.1# |
| n − 1 |
Onde
x é a média dos elementos determinada conforme tópico anterior.
A divisão por n − 1 e não por n ocorre para produzir uma estimativa melhor da variância real da população (em geral, os desvios das amostras tendem a ser menores que os das respectivas populações). Entretanto, se o tamanho da amostra é razoável, há pouca diferença entre dividir por n − 1 ou dividir por n, e ambas as formas podem ser usadas (é comum a notação s
n2 para a variância da amostra calculada com a divisão por n).
Se os dados estão agrupados em m faixas e cada faixa tem valor médio x
i e freqüência relativa r
i,
s2 ≈ [ ∑i=1...n (xi − x)2 ri ] #C.3#.
Exemplo 01: para a tabela do tópico anterior,
| x (mm) |
45,07 |
45,01 |
44,95 |
44,99 |
45,02 |
44,87 |
45,11 |
45,03 |
a variância calculada é
s2 ≈ 0,00537 segundo fórmula #C.1#.
Exemplo 02: para a segunda tabela do tópico anterior,
| x (h) |
55 |
65 |
75 |
85 |
95 |
105 |
115 |
125 |
135 |
145 |
155 |
| a |
5 |
7 |
10 |
21 |
33 |
32 |
22 |
13 |
2 |
3 |
2 |
| r |
0,03 |
0,05 |
0,07 |
0,14 |
0,22 |
0,21 |
0,15 |
0,09 |
0,01 |
0,02 |
0,01 |
a variância calculada é
s2 ≈ 380,51 segundo fórmula #C.3#.
Desvio-padrão
É definido pela raiz quadrada da variância e simbolizado por s. Portanto,
s = √s2 #D.1#, onde s
2 é a variância conforme item anterior.
Coeficiente de variação
É um parâmetro definido pela relação entre o desvio-padrão e a média:
Entretanto, a sua aplicação é limitada. Não há sentido se a média é igual a ou próxima de zero.
Topo |
Índice do grupo |
Página anterior |
Próxima página |
Última revisão ou atualização: Fev/2008