Como você encontra a média da variável aleatória # x #?

Responda:

Significar: #mu=1.4#
Variação: #sigma^2=0.64#
Desvio padrão: #sigma=0.8#

Explicação:

Nos é dado que #X# poderia assumir os valores #{0,1,2,3}# com respectivas probabilidades #{0.15, 0.35, 0.45, 0.05}#. Desde a #X# é discreto, podemos imaginar #X# como uma matriz do tipo 4 que é ponderada para que caia em "0" 15% do tempo, "1" 35% do tempo, etc.

A questão é: quando lançamos este dado uma vez, que valor devemos esperar obter? Ou talvez, se rolamos o dado um grande número de vezes, qual deve ser o valor médio de todos esses lançamentos?

Bem, dos 100% dos rolos, 15% deve ser "0", 35% deve ser "1", 45% deve ser "2" e 5% deve ser "3". Se somarmos tudo isso, teremos o que é conhecido como média ponderada.

De fato, se colocarmos esses pesos relativos em seus pontos correspondentes em uma linha numérica, o ponto que "equilibraria a balança" é a média que buscamos.

Essa é uma boa maneira de interpretar a média de uma variável aleatória discreta. Matematicamente, a média #mu# é a soma de todos os valores possíveis, ponderados por suas probabilidades. Como fórmula, é isso:

#mu = E[X] = sum_("all " x)[x * P(X=x)]#

No nosso caso, isso funciona como:

#mu = [0*P(0)]+[1*P(1)]+[2*P(2)]+[3*P(3)]#
#color(white)mu=(0)(0.15)+(1)(0.35)+(2)(0.45)+(3)(0.05)#
#color(white)mu="       "0"       "+"    "0.35"    "+"     "0.9"     "+"    "0.15#
#color(white)mu=1.4#

Portanto, em um grande número de rolos, esperamos que o valor médio do rolo seja #mu=1.4#.

A variação é uma medida do "spread" de #X#. Voltando à nossa idéia de "linha numérica equilibrada", se movermos nossos pesos para fora do nosso "centro de gravidade" #mu# para que estejam duas vezes mais longe, #mu# ela mesma não mudaria, mas a variação aumentaria por um fator de 4.

Isso porque a variação #sigma^2# de uma variável aleatória é a média ao quadrado distância entre cada valor possível e #mu#. (Marcamos as distâncias de forma que todas sejam positivas.) Como fórmula, é isso:

#sigma^2="Var"(X)=E[(X-mu)^2]#

Usando um pouco de álgebra e teoria das probabilidades, isso se torna

#sigma^2=E[X^2]-mu^2#
#color(white)(sigma^2)=sum_("all x")x^2P(X=x)" "-" "mu^2#

Para este problema, obtemos

#sigma^2=[0^2*P(0)]+[1^2*P(1)]+[2^2*P(2)]#
#color(white)(sigma^2=)+[3^2*P(3)]" "-" "1.4^2#
#color(white)(sigma^2)=(0)(0.15)+(1)(0.35)+(4)(0.45)+(9)(0.05)#
#color(white)(sigma^2=)-1.96#
#color(white)(sigma^2)=0.64#

Portanto, a distância quadrada média entre cada possível #X# valor e #mu# is #sigma^2=0.64#.

O desvio padrão é fácil - é apenas a raiz quadrada da variação. Mas, por que se preocupar com isso, se é praticamente o mesmo? Porque as unidades de #sigma^2# são o quadrado das unidades de #X#. E se #X# mede o tempo, por exemplo, sua variação está em unidades de #"(time)"^2#, o que realmente não nos ajuda se estivermos tentando estabelecer uma "margem de erro".

É aí que entra o desvio padrão. O desvio padrão #sigma# of #X# é uma medida de quão longe #mu# devemos esperar #X# ser estar. É simplesmente

#sigma= sqrt (sigma^2)#

Para esse problema, isso funciona para ser

#sigma = sqrt(0.64)=0.8#

Então, toda vez que escolhemos um #X#, a distância esperada entre #mu# e que #X# is #sigma=0.8#. E desde #sigma# está nas mesmas "unidades" que #X#, é muito mais fácil usar para nos ajudar a criar uma margem de erro. (Vejo: intervalos de confiança.)