Anotações & Informações | Fim pág | Voltar |


Probabilidades e estatística III-20

| Índice do grupo | Página anterior | Próxima página |

Tópicos: Momentos | Assimetria | Curtose |


1) Momentos

(Topo | Fim pág)

Para uma variável aleatória X (que é o caso de uma população), foram dados, em página anterior, alguns conceitos básicos de momento de ordem k, simbolizado por E(Xk).

Para o caso discreto, onde p(xi) é a função de probabilidade, tem-se:

$$E(X^k) = \sum x_i^k p(x_i) \tag{1A}$$
Para o caso contínuo, onde f(x) é a função de densidade de probabilidade, tem-se:

$$E(X^k) = \int_{-\infty}^{+\infty} x^k f(x) dx \tag{1B}$$
A esperança ou média μ é o momento de primeira ordem, ou seja,

$$\mu = E(X) \tag{1C}$$
Momento central de ordem k é o momento anterior em relação a essa média:

$$E\left[(X-\mu)^k\right] = \left \{ \begin{array}{ll} \sum (x_i - \mu)^k p(x_i) & \mathrm{discr} \\ \\ {\displaystyle \int_{-\infty}^{+\infty} } (x-\mu)^k f(x) dx & \mathrm{cont} \end{array}\right. \tag{1D}$$

É usual o símbolo μ acrescido de apóstrofo e índice k para o momento de ordem k e com apenas índice k para o momento central de ordem k, isto é,

$$\mu_k' = E[X^k]\\\mu_k = E[(X - \mu)^k] \tag{1E}$$
Considerando agora uma amostra de n elementos x1, x2 ... xn, usam-se os símbolos m'k e mk para os momentos dessa amostra.

Momento de ordem k:

$$m_k' = \frac{1}{n} \sum (x_i)^k \tag{1F}$$
Momento central de ordem k:

$$m_k = \frac{1}{n} \sum (x_i - \overline x)^k \tag{1G}$$
As seguintes igualdades são similares às igualdades já informadas para o caso de variável aleatória ou de população:

$$\overline x = m_1'\\ m_1 = 0\\ s^2 = m_2\\ s^2 = m_2' - (m_1')^2 \tag{1H}$$
Para dados agrupados em faixas, cada faixa com valor médio xi e freqüência relativa ri, o momento central de ordem k pode ser calculado por:

$$m_k = \sum (x_i - \overline x)^k r_i \tag{1I}$$

2) Assimetria

(Topo | Fim pág)

É uma medida da igualdade ou da desigualdade da distribuição dos valores em torno de uma média. Usam-se os símbolos γ1 e g1 para indicar referência a população e amostra respectivamente.

Simetria e Assimetria de Distribuições
Fig II-1

A assimetria de uma população é dada por (onde γ3 e μ2 são os momentos centrais de terceira e de segunda ordem):

$$\gamma_1 = \frac{\mu_3}{(\mu_2)^{3/2}} \tag{2A}$$
Para uma amostra, há fórmula similar:

$$g_1 = \frac{m_3}{(m_2)^{3/2}} \tag{2B}$$
Uma distribuição cuja curva da função de densidade tem simetria geométrica em relação à média, tem assimetria nula. Exemplo conforme (b) da Figura II-1. Assimetria negativa significa valores concentrados à direita, conforme exemplo (c) da mesma figura. Em geral a média é menor que a mediana. Assimetria positiva significa valores concentrados à esquerda, conforme exemplo (a) da figura. Em geral, a média é maior que a mediana.

Há também duas fórmulas simples, sugeridas por Karl Pearson, para a assimetria:

$$\frac{\mu - mo}{s}\\ 3\frac{\mu - m}{s} \tag{2C}$$
Nessas fórmulas, μ → média, mo → moda, m → mediana, s → desvio-padrão.


3) Curtose

(Topo | Fim pág)

Curtose é um indicador do achatamento da curva da função de densidade, significando valores mais altos para curvas afuniladas e mais baixos para curvas achatadas. É definida pela relação entre o momento central de quarta ordem e o quadrado do momento central de segunda ordem (ou o desvio-padrão elevado a quatro):

$$\beta_2 = \frac{\mu_4}{(\mu_2)^2} = \frac{\mu_4}{\sigma^4} \tag{3A}$$
Entretanto, desde que a distribuição normal padrão apresenta esse valor igual a 3, é mais comum indicar a curtose com referência a essa distribuição. E a denominação usual passa a ser excesso de curtose.

Curvas com Diferença de Curtose
Fig III-1

Então, o excesso de curtose de uma população é dado por:

$$\gamma_2 = \frac{\mu_4}{(\mu_2)^2} - 3 = \frac{\mu_4}{\sigma^4} - 3 \tag{3B}$$
Nota-se que é usado o mesmo símbolo da assimetria (γ), mas com índice 2. Com essa definição, excesso de curtose da distribuição normal padrão é nulo e serve como referência.

Para uma amostra, o excesso de curtose é calculado por:

$$g_2 = \frac{m_4}{(m_2)^2} - 3 = \frac{m_4}{s^4} - 3 \tag{3C}$$
Os termos da tabela a seguir são usados para indicar a faixa do excesso de curtose de uma distribuição.

Tabela III-1
Faixa Termo Exemplo Fig III-1
Positiva Leptocúrtica (a)
Nula Mesocúrtica (b)
Negativa Platicúrtica (c)


Exemplo III-1 (questão de prova): um indicador W que mede a qualidade de determinado produto é uma variável aleatória contínua simetricamente distribuída em torno de 7. Tal indicador assume apenas valores positivos e em 75% dos casos seu valor é superior a 3. Com base nessas informações, julgue os itens subsequentes.

a) A curtose de W é igual a zero.
b) A mediana de W é igual a 7.
c) O terceiro quartil é igual a 3.
d) A moda de W é igual à média da distribuição.
e) A probabilidade de W ser maior que 14 é igual a zero.

Solução: se a variável aleatória tem distribuição de forma simétrica em relação a 7, pode-se supor algo como a curva da figura a seguir (a forma da curva é ilustrativa. Pode não ser passível de determinação).

Exemplo de Distribuição
Fig III-2

Os dados informados não permitem calcular a curtose. Portanto, a questão (a) tem resposta errado.

Se a distribuição de W é simétrica em torno de 7 a média é 7 e a mediana é igual. Questão (b) tem resposta certo.

Se 75% dos valores são superiores a 3, os outros 25% são iguais ou inferiores. Assim, o primeiro quartil é 3, indicado pela área sombreada esquerda. O terceiro quartil é simétrico e igual a 11. Portanto, questão (c) tem resposta errado.

A questão (d) pode enganar, uma vez que, para uma curva simétrica, a moda (valor mais frequente) pode ser igual à média. Nada impede que, para os dados indicados, a distribuição tenha dois picos simétricos em torno da média e mais altos que o dela. Assim, a afirmação nem sempre é válida. Resposta errado.

Se a distribuição é simétrica em torno de 7 e só tem valores positivos, o valor máximo acima de 7 é 14. Então, a probabilidade de W maior que 14 é nula. Portanto, questão (e) tem resposta certo.
Referências
APOSTOL, Tom M. Calculus. USA: Blaisdell, 1969.
GRINSTEAD, Charles M. SNELL, J. Laurie. Introduction to Probability.
NIST/SEMATECH e-Handbook of Statistical Methods. http://www.itl.nist.gov/div898/handbook/.

Topo | Rev: Fev/2018