Variância e Desvio-Padrão — Introdução

Rodrigo-StatsPY
2 min readMar 13, 2021

A variância, simbolizada por S², determina o quão distantes da média estão os pontos de um conjunto de dados. É a medida mais comum de dispersão. È calculada utilizando-se a seguinte fórmula:

Fórmula Variância

Importante entender que a variância é calculada pela somatória das diferenças entre cada ponto de dado e a média do conjunto de dados, ao quadrado. Eleva-se ao quadrado para evitarmos a ocorrência de valores negativos , por exemplo: se a média dos dados fosse 12 e tivéssemos um ponto com valor 9, então (9–12) = (-3). Desta forma, valores negativos e positivos poderiam anular-se, prejudicando a análise de dispersão dos dados.

Outra consequência de se elevar ao quadrado a somatória das dispersões é que a unidade de medida final, estará ao quadrado. Por exemplo, se os dados estão sendo medidos em metros(m) então o valor da variância será metro ao quadrado(m²).

O desvio-padrão é calculado de acordo com a seguinte fórmula:

Fórmula do desvio-padrão

Ou seja, o desvio-padrão é a raiz quadrada da variância, já explicada acima. Ao se calcular a raiz quadrada da variância obtemos as dimensões originais dos dados, ou seja, se os dados estão em metros, então o desvio padrão também estará em metros.

O desvio-padrão (SD) é a medida mais comum de dispersão em um conjunto de dados e de mais fácil entendimento . Abaixo um gráfico que mostra 3 conjuntos de dados com a mesma média mas com desvios-padrão diferentes. Observe como é nítido o quão dispersos estão os dados da média central na curva “verde” comparada à curva “vermelha”.

Fonte: IMD Metrópole Digital

Nós próximos artigos mostrarei como devemos tomar certos cuidados ao analisarmos o desvio padrão, uma vez que, por ele estar intimamente relacionado à média de um conjuntos de dados, valores fora do comum “outliers” podem influenciar fortemente o valor da variância e, consequentemente, do desvio-padrão.

Fique atento aos próximos artigos.

--

--

Rodrigo-StatsPY

Machine Learning | Estatística | Engenharia Química