Já vimos em artigos anteriores medidas de tendência central e de dispersão. Neste artigo vamos falar sobre covariância. 

Vamos começar do básico, afinal o que é covariância?

Covariância é um cálculo estatístico que serve para ajudá-lo a entender a relação que dois grupos de dados tem um com o outro.

Como exemplo podemos imaginar a seguinte situação:

Existem dois antropólogos estudando o peso e altura da população em determinada cidade, nesse caso o peso e altura de cada pessoa poderão ser representados por um par de dados (X,Y) valores os quais podem ser utilizados na fórmula padrão da covariância para calculá-la.

Primeiro passo

Primeiro deve-se entender a fórmula padrão da variância. Veja abaixo:

  • ?: Sigma. Esta é a letra sigma que representa a somatória dos itens que a seguem em todas as posições de um conjunto;
  • xi: Aqui o i  representa um índice. Ele está indicando que você está utilizando o valor de x na posição i;
  • Xmed: Representa o valor médio do valor de x em todas as posições. Ele também pode ser escrito como um x com uma barra em cima do x sendo chamado de x barra;
  • Yi: A mesma coisa que o Xi. Só que ao invés de representar o x na posição i representa o y nessa posição;
  • Ymed: Representa o valor médio do valor de y em todas as posições ele também pode ser escrito como um y com uma barra em cima do x sendo chamado de y barra;
  • N: Essa variável representa a quantidade de itens em um conjunto de dados;

Segundo passo

Depois de entender a fórmula padrão é preciso coletar todos os dados. É ideal que se tenha a tabela com no mínimo 5 colunas.

Na coluna X você coloca os valores dos pontos de dados em x.

Coluna Y aqui você coloca os valores dos pontos de dados em y. Aqui você deve tomar muito cuidado para botar os valores de y da mesma posição do valor x que está ao lado. Por exemplo, o primeiro valor de y deve ser colocado ao lado do primeiro valor de x.

Coluna Xi-Xmed. No início essa coluna ficará em branco porque ela só será preenchida depois de calcularmos a média dos pontos de x.

A coluna Yi-Ymed é outra coluna que ficará em branco no início sendo posteriormente preenchida depois de calcularmos a média dos pontos de y.

E por fim a coluna produto.  Na medida em que você avançar na resolução você deverá ir preenchendo ela. Porém, de início ficará em branco.

Terceiro passo

Agora é necessário que você calcule a média dos pontos de x. Por exemplo, o conjunto 5, 15, 6 e 11. Para calcular a média entre eles some todos e divida por 4  que dará 37/4. O resultado será 9,25. Esse valor será usado como Xmed no futuro.

Quarto passo

Calcule agora a média dos pontos de y do mesmo exemplo de 4 itens. Temos os valores 7, 21, 14, 3. 

Para calcular o ymed os somamos e dividimos por 4 o que resultará em 45/4=11,25. Este valor será utilizado como Ymed no futuro.

Quinto passo

Calcule agora os valores de Xi-Xmed.

Finalmente na terceira coluna você precisará calcular a diferença entre cada número de x e o Xmed. Para saber se o resultado é positivo é bem simples. Se estiver acima da média é positivo e se tiver abaixo é negativo. É importante ficar atento aos sinais negativos.

Deves repetir os dados para todos os pontos resultando no seguinte conjunto -4,25 ,  5,75 , -3,25 , 1,75.

Sexto passo

Calcule os valores de Yi-Ymed. Você fará o mesmo que com Xi-Xmed. A diferença é que com os valores de y (também deve ficar atento aos valores negativos).

Nesse caso a coluna ficara assim:

-4,25 , 9,75 , 3,75 , –8,25

Sétimo passo

Sim finalmente preencheremos a ultima coluna.

Para isso basta multiplicar os valores de Xi-Xmed por Yi-Ymed. Deve ser feito esse processo em cada linha.

Na primeira linha os valores são -4,25 e -4,25 (deu igual por coincidencia) o que resultara em  18,0625.

Após multiplicar todos você terá o seguinte conjunto 18,0625 ,  56,0625 , -12,1875 e  -14,4375.

Oitavo passo

Calcular a soma dos valores da última coluna e após calcular todos os valores até aqui deve soma-los.

A soma nesse caso será de 47,5 você deve escrever esse valor no espaço da base da coluna esse valor representará o valor do numerador na fórmula padrão de covariância.

Nono passo

Calcule o denominador da fórmula de covariância.

É bem fácil, basta diminuir 1 do número total de itens na última tabela que é 4 4-1=3. Logo o denominador é igual a 3.

Décimo passo

Agora basta dividir o numerador pelo denominador que fica igual a 47,5/3 que dá igual a 15,83.

E pronto você calculou a covariança!

Espero ter lhe ajudado a esclarecer todas as dúvidas sobre covariança. Quaisquer outras dúvidas, fique a vontade para deixar nos comentários abaixo.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Comentários

Juliana - 03/07/2018

Olá. Minha dúvida é como interpretar o resultado. O que 15,83 significa nessa análise de amostra da população? Que há relação entre os dados?

Kleber Stumpf - 04/07/2018

Oi Juliana, tudo bem? A covariância serve para medir a relação linear entre duas variáveis. ;) Visite meu canal no YouTube! Adquira nosso curso completo da para as provas da ANBIMA. Curta nossa página no facebook e não esqueça de compartilhar nosso conteúdo para que possamos continuar com a educação financeira gratuita. Um abraço, Kléber Stumpf