Curtose ou Kurtosis

 Introdução

A métrica curtose ou kurtosis se refere a uma medida usada em probabilidade ou estatística para distinguir a forma das curvas de frequências, funções de densidade ou funções de probabilidade quanto ao grau de achatamento.

É por meio dessa medida que caracterizamos as curvas em platicúrtica, mesocúrtica ou leptocúrtica. Vamos detalhar um pouco mais o significado, interpretação e usos da medida de curtose.

Curtose ou kurtosis


Contextualização

Para melhor contextualizar, partimos do sistema de Pearson que defendia a ideia de que as curvas ficavam bem determinadas se conhecêssemos os 4 primeiros momentos. Esses momentos eram calculados em temos do valor central caracterizado pelo primeiro momento, mais conhecido como média. $$\mu=\hbox{E}(X)$$

Partindo do primeiro momento $\mu$, Pearson definiu a variável reduzida $$u=\frac{X-\mu}{\sigma}$$ onde $\sigma$ é o desvio padrão. Usando essa variável ele definiu $\hbox{E}(u^k)=\alpha_k$. Assim temos: $$\alpha_1=0$$ $$\alpha_2=1$$ $$\alpha_3=\frac{\hbox{E}(X-\mu)^3}{\sigma^3}$$ $$\alpha_4=\frac{\hbox{E}(X-\mu)^4}{\sigma^4}$$ 

Onde $\alpha_3$ e $\alpha_4$ são os coeficientes de assimetria e curtose, respectivamente.

Classificação das curvas

A medida de curtose nos informa se uma determinada curva de frequência é mais achatada (como um platô), mais afilada (mais alta) ou muito próxima ao comportamento da curva de Gauss.

Mesocúrtica

A maior parte das aplicações e técnicas de estatística consideram os dados provenientes de uma distribuição de probabilidade do tipo gaussiana, devido à curva de Gauss, em forma de sino, aparecer naturalmente em diversos problemas na natureza.

Por esse motivo acima a cura de densidade da distribuição normal é considerada a referência em muitas aplicações.

A curtose da distribuição normal é considerada como nula, por esse motivo o seu comportamento padrão é tomado como uma curva de forma mesocúrtica.

Platicúrtica

As curvas com comportamento de um platô, portanto abaixo da curva gaussiana, são consideradas platicúrtica. Neste caso a curtose é negativa.

Em linguagem vulgar dizemos que as curvas platicúrticas são mais achatadas.

Leptocurtose

As curvas mais afiladas e, portanto, mais altas que a distribuição normal têm comportamento leptocúrtico (curvas leptocúrticas). 
É comum a aplicação desses conceitos nas variáveis aleatórias contínuas.

Coeficiente de Curtose

O trabalho com dados estatísticos se inicia com uma análise exploratória de dados. Dessa forma é comum realizarmos medidas descritivas dos dados como assimetria e curtose. Além disso são importantes estatísticas de ordem e medidas de dispersão.

Veja alguns detalhes acerca dessa métrica:

Coeficiente de CurtoseForma da Curva
 $\alpha_4= 0$mesocúrtica, portanto mais próxima da curva de Gauss
$\alpha_4>0$leptocúrtica, mais afilada que a normal
$\alpha_4< 0$platicúrtica, mas parecida com um platô
Uso : como medida de forma
 

Referência: Jonh W. Tukey: Exploratory Data Analysis.

Comentários

Postagens mais visitadas deste blog

Box-plot Definição e Aplicação

Assimetria

Desvio Padrão: O que é e como calcular