Anotações & Informações | Índice | Fim pág | Voltar |


Probabilidades e Estatística II-20

| Índice do grupo | Página anterior | Próxima página |

Tópicos: Distribuição Binomial | Distribuição Hipergeométrica |


1) Distribuição Binomial

(Topo | Fim pág)

Em página anterior já foi visto que a probabilidade de k sucessos em uma sequência de n eventos independentes, com probabilidade individual p de sucesso e q de falha, é dada pela fórmula de Bernoulli:

$$\binom{n}{k} p^k q^{n-k} \tag{1A}$$
Substituindo k por x para coerência com os símbolos aqui usados, esta fórmula é a função de probabilidade de uma variável aleatória discreta para a distribuição binomial:

$$p(x) = P(X=x) = \binom{n}{x} p^x q^{n-x} \tag{1B}$$
Onde:

n: número total de eventos
x: número de sucessos
p: probabilidade de sucesso
q: probabilidade de falha (= 1 − p)

O coeficiente binomial, também simbolizado por C(n, k), é calculado por:

$$\binom{n}{k} = \frac{n!}{k! (n-k)!} \tag{1C}$$
Distribuição Binomial
Fig I-1

A função de distribuição correspondente é dada por:

$$F_X(x) = \sum_{0\leq t \leq x} \binom{n}{t} p^t q^{n-t} \tag{1D}$$
Os valores n e p são denominados parâmetros da distribuição binomial. Em (a) da Figura I-1, gráfico da função de distribuição e, em (b), a função de probabilidade, ambas para n = 10 e p = 0,3.

A média e a variância podem ser determinadas a partir das fórmulas já vistas em página anterior. Omitindo o desenvolvimento matemático e a simplificação das expressões, os resultados são:

$$E(X) = n \ p\\ \mathrm{Var}(X) = n \ p \ q \tag{1E}$$
Exemplo 01: uma prova tem 20 questões de múltipla escolha com 4 opções cada e uma resposta certa por questão. Analisar algumas probabilidades de resposta ao acaso de todas as questões.

Para este exemplo,

n = 20
p = 1/4 = 0,25
q = 1 − p = 0,75

A esperança ou média é dada por:

E(X) = np = 20 0,25 = 5

Ou seja, se respondidas todas ao acaso, o estudante pode esperar um acerto de 5 questões. Mas nem todos que responderem ao acaso terão 5 acertos. Se vários estudantes respondem ao acaso, o desvio médio quadrático em relação a essa média é dado pelo desvio padrão:

σ2 = Var(X) = n p q = 20 0,25 0,75 = 3,75. Portanto,

σ ≈ 1,94

Supõe-se agora que o critério de aprovação seja um mínimo de 12 respostas certas. Pode-se usar a fórmula da função de distribuição (1D) para calcular a probabilidade de até 11 respostas certas:

$$F_X(11) = \sum_{0\leq t \leq 11} \binom{20}{t} 0,25^t 0,75^{20-t}\\F_X(11) = P(X \leq 11) \approx 0,999$$
Portanto, a probabilidade de aprovação com respostas ao acaso é aproximadamente 1 − 0,999 = 0,001

Exemplo 02: uma moeda ideal é jogada 20 vezes. Calcular a probabilidade de se obter exatamente 10 caras.

Para este exemplo, os parâmetros dados são:

n = 20
p = 0,5
q = 1 − p = 0,5

Desde que se deseja apenas um valor, a função de probabilidade é usada diretamente:

$$P(10) = \binom{20}{10} 0,5^{10} 0,5^{20-10}\\P(10) \approx 0,1762$$

2) Distribuição Hipergeométrica

(Topo | Fim pág)

É uma outra distribuição discreta, aplicável a casos de número de sucessos em uma amostra retirada, sem reposição, de uma população finita. Seja o exemplo a seguir.

Supõe-se que um lote de N peças contenha D peças com defeito (portanto, D ≤ N) e, desse lote, retira-se uma amostra de n peças ao acaso. Deseja-se saber a probabilidade de encontrar x peças com defeito na amostra de n peças (a tabela a seguir dá um resumo. O "sucesso" mencionado significa "peça com defeito").

Tabela II-1
Na amostra Fora da amostra Somas
Defeituosos x D − x D
Não defeituosos n − x N − D − (n − x) N − D
Totais n N − n N

À medida que são retiradas peças para formar a amostra, o tamanho da população diminui e, portanto, a probabilidade de sucesso varia. Assim, o problema não pode ser resolvido com a distribuição binomial porque os eventos não são independentes.

É possível demonstrar que, para casos do exemplo e similares, ocorre a distribuição hipergeométrica, cuja função de probabilidade é dada por:

$$p(x) = P(X=x) = \frac{\binom{D}{x} \binom{N-D}{n-x}}{\binom{N}{n}} \tag{2A}$$
N: número total de elementos
D: número de elementos qualificados de sucesso
n: tamanho da amostra
x: número de sucessos na amostra

Média da distribuição hipergeométrica:

$$E(X) = \frac{n\ D}{N} \tag{3B}$$
Variância da distribuição hipergeométrica:

$$\mathrm{Var}(X) = \frac{n \tfrac{D}{n} \big(1-\tfrac{D}{n}\big)(N-n)}{N-1} \tag{3C}$$
Apesar da distinção, a distribuição hipergeométrica se aproxima da binomial se o tamanho da população é grande em relação à amostra (N >> n). Nesse caso, seus parâmetros são n (amostra) e p = D/N.

Exemplo: um jogo de loteria é feito a partir de um conjunto de 55 bolas numeradas de 1 a 55 O resultado é dado pelos números de 5 bolas retiradas, aleatoriamente e sem reposição, desse conjunto. Os bilhetes vendidos são numerados com cinco números sem repetição entre 1 e 55. Calcular a probabilidade de um bilhete acertar três números.

Consideram-se os seguintes parâmetros:

N = 55 (tamanho total).
D = 5 (quantidade de sucessos no total, isto é, as bolas sorteadas).
n = 5 (tamanho da amostra, ou seja, quantidade de números no bilhete).
x = 3 (número de acertos ou sucessos na amostra, que é o bilhete).

Portanto,

$$p(x) = \frac{\binom{5}{3} \binom{55-5}{5-3}}{\binom{55}{5}} \approx 0,0035$$
Referências
APOSTOL, Tom M. Calculus. USA: Blaisdell, 1969.
GRINSTEAD, Charles M. SNELL, J. Laurie. Introduction to Probability.
NIST/SEMATECH e-Handbook of Statistical Methods. http://www.itl.nist.gov/div898/handbook/.

Topo | Rev: Fev/2018