Qual é a relação entre R-Squared e o coeficiente de correlação de um modelo?

Responda:

Vejo esta . Crédito para Gaurav Bansal.

Explicação:

Eu estava tentando pensar na melhor maneira de explicar isso e me deparei com uma página que faz um trabalho muito bom. Prefiro dar a esse cara o crédito pela explicação. Caso o link não funcione para alguns, incluí algumas informações abaixo.

Simplificando: o #R^2# valor é simplesmente o quadrado do coeficiente de correlação #R#.

O coeficiente de correlação ( #R# ) de um modelo (digamos, com variáveis #x# e #y#) assume valores entre #-1# e #1#. Descreve como #x# e #y# estão correlacionados.

  • If #x# e #y# estão em perfeito uníssono, então esse valor será positivo #1#
  • If #x# aumenta enquanto #y# diminui exatamente da maneira oposta, esse valor será #-1#
  • #0# seria uma situação em que não há correlação entre #x# e #y#

No entanto, isso #R# O valor é útil apenas para um modelo linear simples (apenas um #x# e #y#) Depois de considerarmos mais de uma variável independente (agora temos #x_1#, #x_2#, ...), é muito difícil entender o que significa o coeficiente de correlação. O rastreamento de qual variável contribui com o que a correlação não é tão claro.

Este é o lugar onde o #R^2# valor entra em jogo. É simplesmente o quadrado do coeficiente de correlação. Leva valores entre #0# e #1#, onde valores próximos a #1# implicam mais correlação (correlacionada positiva ou negativamente) e #0# não implica correlação. Outra maneira de pensar nisso é como a variação fracionária na variável dependente que é o resultado de todas as variáveis ​​independentes. Se a variável dependente for altamente dependente de todas as suas variáveis ​​independentes, o valor estará próximo de #1#. Assim #R^2# é muito mais útil, pois também pode ser usado para descrever modelos multivariados.

Se você quiser discutir algumas das noções matemáticas envolvidas na relação dos dois valores, consulte esta .