Qual é a relação entre R-Squared e o coeficiente de correlação de um modelo?
Responda:
Vejo esta . Crédito para Gaurav Bansal.
Explicação:
Eu estava tentando pensar na melhor maneira de explicar isso e me deparei com uma página que faz um trabalho muito bom. Prefiro dar a esse cara o crédito pela explicação. Caso o link não funcione para alguns, incluí algumas informações abaixo.
Simplificando: o R2 valor é simplesmente o quadrado do coeficiente de correlação R.
O coeficiente de correlação ( R ) de um modelo (digamos, com variáveis x e y) assume valores entre −1 e 1. Descreve como x e y estão correlacionados.
- If x e y estão em perfeito uníssono, então esse valor será positivo 1
- If x aumenta enquanto y diminui exatamente da maneira oposta, esse valor será −1
- 0 seria uma situação em que não há correlação entre x e y
No entanto, isso R O valor é útil apenas para um modelo linear simples (apenas um x e y) Depois de considerarmos mais de uma variável independente (agora temos x1, x2, ...), é muito difícil entender o que significa o coeficiente de correlação. O rastreamento de qual variável contribui com o que a correlação não é tão claro.
Este é o lugar onde o R2 valor entra em jogo. É simplesmente o quadrado do coeficiente de correlação. Leva valores entre 0 e 1, onde valores próximos a 1 implicam mais correlação (correlacionada positiva ou negativamente) e 0 não implica correlação. Outra maneira de pensar nisso é como a variação fracionária na variável dependente que é o resultado de todas as variáveis independentes. Se a variável dependente for altamente dependente de todas as suas variáveis independentes, o valor estará próximo de 1. Assim R2 é muito mais útil, pois também pode ser usado para descrever modelos multivariados.
Se você quiser discutir algumas das noções matemáticas envolvidas na relação dos dois valores, consulte esta .