MSPC - Informações Técnicas

. . . | Início | Mapa | Uso etc | Pesquisar | Fim pág | Voltar |



Probabilidades e estatística II-40




Índice do grupo | Página anterior | Próxima página |

Distribuição normal |



Distribuição normal

   (Topo pág | Fim pág)

Esta é, sem dúvida, a distribuição estatística mais comum e importante. Ocorre em uma variedade de fenômenos físicos naturais, em estudos de comportamento humano, em processos industriais, etc. Também denominada distribuição gaussiana por ter sido usada pelo físico e matemático alemão Carl Friedrich Gauss (1777 - 1855) no estudo de dados astronômicos.

Outra expressão associada à distribuição normal é a curva do sino, em razão da semelhança geométrica da curva da função de densidade. Cabe também citar que a qualificação normal tem origem histórica e não significa que outras distribuições não sejam normais no sentido usual da palavra.

Uma variável aleatória X é dita ter distribuição normal se a função de densidade de probabilidade é dada por:

#A.1#

π: constante matemática (≈ 3,14159).
e: constante matemática (≈ 2,71828).
μ: parâmetro de localização. É a média da distribuição.
σ: parâmetro de forma. É o desvio-padrão da distribuição.

A função de distribuição acumulada é usualmente dada em termos de integral da função de densidade de acordo com a relação básica entre elas:

#B.1#


Média da distribuição normal:

E(X) = μ#C.1#

Variância da distribuição normal:

Var(X) = σ2#D.1#

A Figura 01 exibe gráficos aproximados das funções de distribuição e de densidade para algumas combinações de μ e σ².

Distribuição normal
Fig 01

Distribuição normal padrão é a distribuição normal com média nula e desvio-padrão unitário, isto é, μ = 0 e σ = 1 (na Figura 01, corresponde às curvas de linha contínua).

As funções de densidade e de distribuição para este caso são identificadas pelo uso das letras gregas φ e Φ (minúscula e maiúscula) no lugar de f e F. Portanto,

#E.1#

#E.2#


Notação usual para a distribuição normal

Se uma variável aleatória X tem distribuição normal de média μ e variância σ2, escreve-se

X ~ N(μ, σ2)#F.1#

Portanto, se Z tem distribuição normal padrão,

Z ~ N(0, 1)#F.2#


A função geratriz de momentos da distribuição normal pode ser facilmente deduzida a partir da definição. O resultado é

#G.1#


Teorema 01

Seja a variável aleatória X ~ N(μ, σ2). Se Y é uma variável aleatória tal que Y = aX + b onde a ≠ 0, então Y ~ N(a μ + b, a2 σ2).

Demonstração: segundo propriedade da função geratriz de momentos, MY(t) = exp(bt) MX(at). Portanto,

MY(t) = exp(bt) exp( a μ t + a2 σ2 t2 ) = exp[ (a μ + b) t + a2 σ2 t2 ].

E esta última é a função geratriz de momentos para média (a μ + b) e variância (a2 σ2).

Voltando ao enunciado desse teorema, considera-se a hipótese de

a = 1/σ e b = −μ/σ

Usando Z no lugar de Y por coerência com a notação anterior, tem-se

Z ~ N[ (1/σ) μ − μ/σ, (1/σ)2 σ2 ] = Z ~ N(0, 1)

Em outros termos, pode-se dizer:

Seja X é uma variável aleatória com distribuição normal genérica X ~ N(μ, σ2) e a variável Z dada por:

#H.1#

Então Z tem distribuição normal padrão, isto é, Z ~ N(0, 1). Isso significa que, a partir de valores tabelados da distribuição normal padrão, é possível o cálculo para quaisquer valores dos parâmetros μ e σ2.


Teorema 02

Refere-se à soma de variáveis com distribuição normal. A demostração é omitida.

Sejam as variáveis aleatórias independentes e de distribuição normal:

X ~ N(μX, σX2)
Y ~ N(μY, σY2)

Então a soma tem distribuição normal:

(X + Y) ~ N(μX + μY, σX2 + σY2).

Como corolário do teorema 02, consideram-se as variáveis aleatórias abaixo.

X1 ~ N(μ, σ2)
X2 ~ N(μ, σ2)
...
Xn ~ N(μ, σ2)

Então, a média dessas variáveis, X, tem média μ e variância σ2/n


Teorema 03

Este é um dos mais importantes aspectos da distribuição normal. É comumente denominado teorema do limite central. A demonstração não é aqui apresentada.

Sejam X1, X2, ... , Xn variáveis aleatórias independentes de uma mesma população que apresenta uma determinada distribuição de probabilidades, média μ e desvio-padrão σ.

A soma X = X1 + X2 + ... + Xn tem média n μ e desvio-padrão σ √n.

Pode-se então dizer que, quando n tende para infinito, a distribuição de X se aproxima da distribuição normal, isto é,

X ~ N(n μ, σ2 n)#I.1#

Em outros termos, a distribuição da soma das variáveis aleatórias converge para a distribuição normal se o número de parcelas tende para infinito.

Como exemplo de aplicação, seja a distribuição binomial, que converge para a normal com n grande e com p em valores intermediários, não próximos dos extremos 0 e 1. Neste caso, a média da distribuição normal aproximada é np e a variância np(1 − p). Outro exemplo é a distribuição de Poisson, que, para λ grande, se aproxima da normal com μ = λ e σ2 = λ.


Considerações sobre o desvio-padrão

A Figura 02 mostra a função de densidade para a distribuição normal padrão. De acordo com propriedades da função de densidade, a área total sob a curva é unitária porque indica a probabilidade de todo o conjunto observado. E a área sob a curva entre dois valores quaisquer de x indica a probabilidade da ocorrência entre esses valores.

Distribuição normal
Fig 02

A análise da curva permite a conclusão lógica do que se observa na prática: as ocorrências tendem a concentrar-se em torno de uma média e se tornam mais raras ou menos prováveis à medida que dela se afastam.

Por simples integração da função de densidade, é possível calcular a probabilidade de ocorrência em função do afastamento da média segundo o número de desvios-padrão (valores aproximados com 3 dígitos significativos):

• 0,682 ou 68,2% para faixa μ ± 1 σ.
• 0,954 ou 95,4% para faixa μ ± 2 σ.
• 0,997 ou 99,7% para faixa μ ± 3 σ.

Na faixa μ ± 3 σ ocorre a quase totalidade (99,7%) dos valores. Por isso, ela é, em algumas referências, denominada dispersão natural do processo.


Topo | Página anterior | Próxima página | Última revisão ou atualização: Dez/2007