Qual é a relação entre R-Squared e o coeficiente de correlação de um modelo?

Responda:

Vejo esta . Crédito para Gaurav Bansal.

Explicação:

Eu estava tentando pensar na melhor maneira de explicar isso e me deparei com uma página que faz um trabalho muito bom. Prefiro dar a esse cara o crédito pela explicação. Caso o link não funcione para alguns, incluí algumas informações abaixo.

Simplificando: o R2 valor é simplesmente o quadrado do coeficiente de correlação R.

O coeficiente de correlação ( R ) de um modelo (digamos, com variáveis x e y) assume valores entre 1 e 1. Descreve como x e y estão correlacionados.

  • If x e y estão em perfeito uníssono, então esse valor será positivo 1
  • If x aumenta enquanto y diminui exatamente da maneira oposta, esse valor será 1
  • 0 seria uma situação em que não há correlação entre x e y

No entanto, isso R O valor é útil apenas para um modelo linear simples (apenas um x e y) Depois de considerarmos mais de uma variável independente (agora temos x1, x2, ...), é muito difícil entender o que significa o coeficiente de correlação. O rastreamento de qual variável contribui com o que a correlação não é tão claro.

Este é o lugar onde o R2 valor entra em jogo. É simplesmente o quadrado do coeficiente de correlação. Leva valores entre 0 e 1, onde valores próximos a 1 implicam mais correlação (correlacionada positiva ou negativamente) e 0 não implica correlação. Outra maneira de pensar nisso é como a variação fracionária na variável dependente que é o resultado de todas as variáveis ​​independentes. Se a variável dependente for altamente dependente de todas as suas variáveis ​​independentes, o valor estará próximo de 1. Assim R2 é muito mais útil, pois também pode ser usado para descrever modelos multivariados.

Se você quiser discutir algumas das noções matemáticas envolvidas na relação dos dois valores, consulte esta .