Qual é a diferença entre o desvio padrão da população e o desvio padrão da amostra?
Responda:
Na fórmula para um desvio padrão da população, você divide pelo tamanho da população #N#, enquanto que na fórmula do desvio padrão da amostra, você divide por #n-1# (o tamanho da amostra menos um).
Explicação:
If #mu# é a média da população, a fórmula para o desvio padrão da população dos dados da população #x_{1},x_{2},x_{3},ldots, x_{N}# is
#sigma=sqrt{frac{sum_{k=1}^{N}(x_{k}-mu)^{2}}{N}}#.
If #bar{x}# é a média de uma amostra, a fórmula para o desvio padrão da amostra dos dados da amostra #x_{1},x_{2},x_{3},ldots, x_{n}# is
#s=sqrt{frac{sum_{k=1}^{n}(x_{k}-bar{x})^{2}}{n-1}}#.
A razão pela qual isso é feito é um pouco técnica. Isso faz com que a amostra varie #s^{2}# o chamado estimador imparcial para a variação populacional #sigma^{2}#. De fato, se o tamanho da população for realmente grande e você estiver fazendo muitas, muitas amostras aleatórias do mesmo tamanho #n# dessa grande população, a média de muitos, muitos valores de #s^{2}# terá uma média muito próxima do valor de #sigma^{2}# (e, no que diz respeito a uma perspectiva teórica, a média de #s^{2}# como uma "variável aleatória" será exatamente #sigma^{2}#).
Os detalhes técnicos de por que isso é verdade envolvem muita álgebra com somatórios e geralmente não valem o tempo gasto para os alunos iniciantes.