Desvio Padrão: O que é e como calcular

O desvio padrão é uma medida de dispersão que indica o quanto os valores de um conjunto de dados estão espalhados em torno da média. Ele é uma medida importante na estatística, pois pode ser usado para comparar conjuntos de dados diferentes, avaliar a confiabilidade de uma estimativa e identificar outliers.

Nossa abordagem aqui está inserida no âmbito da estatística descritiva. Para isso consideramos um conjunto de dados $x_1, x_2,\ldots, x_n$, correspondente à uma amostra de tamanho $n$.



Definição

O desvio padrão é definido como a raiz quadrada da variância. A variância é uma medida de dispersão quadrática que indica o quanto os dados estão dispersos em torno da média. Ela é calculada como a soma dos quadrados da diferença entre cada valor e a média, dividida pelo número de dados.

Formulação

A fórmula do desvio padrão é a seguinte: $$s=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\overline{x})}{n}}$$

onde:

  • $s$ é o desvio padrão
  • $x_i$ é cada valor do conjunto de dados
  • $\overline{x}$ é a média do conjunto de dados
  • $n$ é o número de elementos do conjunto de dados

Exemplo

Consideremos o seguinte conjunto de dados: $$1, 2, 3, 4, 5$$

A média desse conjunto de dados é $3$. A variância é calculada como:$$s^2=\frac{\sum_{i=1}^{5}(x_i-\overline{x})^2}{n}$$

$$s^2=\frac{(1-3)^2+(2-3)^2+(3-3)^2+(4-3)^2+(5-3)^2}{5}$$

Portanto a variância é igual a 2. O desvio padrão é calculado como: $$s=\sqrt{2}=1,414$$.

Portanto, o desvio padrão desse conjunto de dados é $1,414$. Isso significa que, em média, os valores do conjunto estão a $1,414$ unidades da média.

Interpretação

Um desvio padrão pequeno indica que os dados estão próximos da média. Um desvio padrão grande indica que os dados estão muito dispersos em torno da média.

Por exemplo, se um desvio padrão é igual a $1$, isso significa que, em média, os valores do conjunto estão a $1$ unidade da média. Se um desvio padrão é igual a $10$, isso significa que, em média, os valores do conjunto estão a $10$ unidades da média.

Aplicações

O desvio padrão pode ser usado em diversas aplicações, como:

  • Comparação de conjuntos de dados: O desvio padrão pode ser usado para comparar conjuntos de dados diferentes. Se o desvio padrão de um conjunto de dados for maior do que o desvio padrão de outro conjunto de dados, isso significa que os dados do primeiro conjunto estão mais dispersos em torno da média do que os dados do segundo conjunto. Entretanto, a medida mais adequada para uma comparação relativa de dois conjuntos de dados é o coeficiente de variação.

  • Avaliação da confiabilidade de uma estimativa: O desvio padrão pode ser usado para avaliar a confiabilidade de uma estimativa. Se o desvio padrão de uma estimativa for pequeno, isso significa que a estimativa é mais confiável.

  • Identificação de outliers: Os outliers são valores inesperadamente grandes ou pequenos. São valores extremos que estão fora do comportamento esperado dos dados. O desvio padrão pode ser usado para identificar outliers. Se um valor estiver fora do intervalo de ±3 desvios padrão da média, ele é considerado um outlier.

Conclusão

O desvio padrão é uma medida importante na estatística. Ele pode ser usado para comparar conjuntos de dados diferentes, avaliar a confiabilidade de uma estimativa e identificar outliers.

Clique no livro indicado de Estatística Básica. Se tem interesse em concurso público conheça o blog de estatística para concurso.

Comentários

Postagens mais visitadas deste blog

Box-plot Definição e Aplicação

Assimetria