Anotações & Informações | Índice | Fim pág | Voltar |


Probabilidades e Estatística III-10

| Índice do grupo | Página anterior | Próxima página |

Tópicos: Medidas de Localização (média, mediana, moda, ponto médio) | Medidas de Dispersão (amplitude, desvio médio, variância, desvio-padrão, coeficiente de variação) |


1) Medidas de Localização

(Topo | Fim pág)

São também denominadas medidas de tendência central. A média é o parâmetro mais significativo e mais usado, mas há outros que serão vistos nos próximos itens.

Média



Seja uma amostra de n elementos x1, x2 ... xn. A média (ou valor médio) é dada por:

$$\overline x = \frac{1}{n} \sum_{i=1}^n x_i \tag{1A}$$
Exemplo I-1: foram tomadas 8 medidas de um determinado comprimento com os resultados abaixo.

x(mm)
45,07
45,01
44,95
44,99
45,02
44,87
45,11
45,03

A média dos valores, calculada segundo (1A), é $\overline x = 45,01 \text{ mm}$

Se os dados estão agrupados em m faixas, cada faixa com valor médio xi e frequência relativa ri, a média do conjunto pode ser calculada por:

$$\overline x = \sum_{i=1}^m x_i r_i \tag{1B}$$
Exemplo I-2: a tabela abaixo indica os tempos de duração de um lote de 150 ferramentas usadas por uma máquina. Estão divididas em grupos de acordo com a duração média: 5 ferramentas duraram em média 55 horas, 7 ferramentas duraram em média 65 horas e assim sucessivamente.

x (h) a r
55 5 0,03
65 7 0,05
75 10 0,07
85 21 0,14
95 33 0,22
105 32 0,21
115 22 0,15
125 13 0,09
135 2 0,01
145 3 0,02
155 2 0,01

As frequências relativas estão calculadas na linha r da tabela pela divisão da frequência absoluta (linha a) pela soma da linha a. Calculando pela fórmula (1B), $\overline x = 99,3 \text{ h}$.

Mediana



Seja uma amostra com n valores x1, x2 ... xn em ordem crescente. A mediana m desses elementos é o valor em relação ao qual uma metade dos elementos tem valores menores e a outra metade tem valores maiores. É calculada por:

$$m = \left \{ \begin{array}{ll} \dfrac{x_{n/2} + x_{(n/2) + 1}}{2} & n \text{ par} \\x_{(n+1)/2} & n \text{ impar} \end{array}\right. \tag{1C}$$

Exemplo I-3: a amostra de valores {3, 3, 4, 5, 6, 7, 8, 8, 10} tem mediana 6. A amostra {4, 6, 7, 9, 11, 12, 14, 15} tem mediana 10.

Do conceito de percentil, visto na página anterior, pode-se concluir que a mediana equivale ao percentil 50 ou ao segundo quartil ou ao quinto decil.

Moda



É o valor que ocorre com mais frequência. Usado apenas para análises qualitativas. Não é necessariamente único e pode não existir. A sua determinação é usualmente feita a partir de um histograma.

Exemplo I-4:

A amostra {3, 4, 9, 11, 12, 15} não tem moda.

A amostra {2, 2, 3, 3, 5, 8, 8, 8, 12, 14} tem moda 8.

A amostra {3, 4, 4, 4, 5, 5, 8, 8, 8, 12, 14} tem modas 4 e 8.

Exemplos de Função de Densidade
Fig I-1

Não há relação matemática entre os parâmetros média, mediana e moda. Mas algumas relações comparativas podem ser observadas de acordo com a geometria da curva da função de densidade. Uma distribuição simétrica, como (b) da Figura I-1, deve ter:

média = mediana = moda

Uma distribuição concentrada à esquerda (a da figura) deve ter:

moda < mediana < média

E uma concentrada à direita (c da figura) deve ter

média < mediana < moda

Ponto Médio



É dado pela média aritmética entre o menor valor e o maior valor. Não é um indicador confiável. Normalmente, só é usado em casos nos quais o comportamento dos valores extremos é importante.


2) Medidas de Dispersão

(Topo | Fim pág)

Enquanto as medidas de localização dão ideia do local da concentração dos valores de uma amostra, as medidas de dispersão dão indicação da magnitude dessa concentração ou dispersão.

Amplitude



É dada pela diferença entre o maior valor e o menor. Portanto, para n valores x1, x2 ... xn, a amplitude é

$$A = \max(x_i) - \min(x_i) \tag{2A}$$

Desvio Médio



É dado pela média dos desvios em relação à média da amostra. Se x1, x2 ... xn são os valores,

$$DM = \frac{1}{n} \sum_{i=1}^n (x_i - \overline x) \tag{2B}$$
Se os dados estão agrupados em m faixas e cada faixa tem valor médio xi e frequência relativa ri,

$$DM = \sum_{i=1}^m (x_i - \overline x) r_i \tag{2C}$$

Variância



Para uma amostra de n elementos x1, x2 ... xn, a variância é calculada por:

$$s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \overline x)^2 \tag{2D}$$
A divisão por n − 1 e não por n ocorre para produzir uma estimativa melhor da variância real da população (em geral, os desvios das amostras tendem a ser menores que os das respectivas populações). Entretanto, se o tamanho da amostra é razoável, há pouca diferença entre dividir por n − 1 ou dividir por n, e ambas as formas podem ser adotadas em vários casos práticos (algumas vezes é usada a notação sn2 para a variância da amostra calculada com a divisão por n).

Se os dados estão agrupados em m faixas e cada faixa tem valor médio xi e frequência relativa ri,

$$s^2 = \sum_{i=1}^m (x_i - \overline x)^2 r_i \tag{2E}$$
Exemplo II-1: seja a tabela do Exemplo I-1 tópico anterior:

x(mm)
45,07
45,01
44,95
44,99
45,02
44,87
45,11
45,03

A variância calculada é s2 ≈ 0,00537 segundo fórmula (2D).

Exemplo II-2: seja a tabela do Exemplo I-2 do tópico anterior:

x (h) a r
55 5 0,03
65 7 0,05
75 10 0,07
85 21 0,14
95 33 0,22
105 32 0,21
115 22 0,15
125 13 0,09
135 2 0,01
145 3 0,02
155 2 0,01

A variância calculada é s2 ≈ 380,51 segundo fórmula (2E).

Desvio-Padrão



É definido pela raiz quadrada da variância e simbolizado por s. Portanto,

$$s = \sqrt s^2 \tag{2F}$$

Coeficiente de Variação



É um parâmetro definido pela relação entre o desvio-padrão e a média:

$$CV = \frac{s}{\overline x} \tag{2G}$$
A sua aplicação é limitada. Não há sentido se a média é igual a ou próxima de zero.
Referências
APOSTOL, Tom M. Calculus. USA: Blaisdell, 1969.
GRINSTEAD, Charles M. SNELL, J. Laurie. Introduction to Probability.
NIST/SEMATECH e-Handbook of Statistical Methods. http://www.itl.nist.gov/div898/handbook/.

Topo | Rev: Fev/2018