Qual é a relação entre R-Squared e o coeficiente de correlação de um modelo?

Responda:

Vejo esta . Crédito para Gaurav Bansal.

Explicação:

Eu estava tentando pensar na melhor maneira de explicar isso e me deparei com uma página que faz um trabalho muito bom. Prefiro dar a esse cara o crédito pela explicação. Caso o link não funcione para alguns, incluí algumas informações abaixo.

Simplificando: o $R^{2}$ $R^2$ valor é simplesmente o quadrado do coeficiente de correlação $R$ $R$ .

O coeficiente de correlação ( $R$ $R$ ) de um modelo (digamos, com variáveis $x$ $x$ e $y$ $y$ ) assume valores entre $- 1$ $-1$ e $1$ $1$ . Descreve como $x$ $x$ e $y$ $y$ estão correlacionados.

If $x$ $x$ e $y$ $y$ estão em perfeito uníssono, então esse valor será positivo $1$ $1$
If $x$ $x$ aumenta enquanto $y$ $y$ diminui exatamente da maneira oposta, esse valor será $- 1$ $-1$
$0$ $0$ seria uma situação em que não há correlação entre $x$ $x$ e $y$ $y$

No entanto, isso $R$ $R$ O valor é útil apenas para um modelo linear simples (apenas um $x$ $x$ e $y$ $y$ ) Depois de considerarmos mais de uma variável independente (agora temos $x_{1}$ $x_1$ , $x_{2}$ $x_2$ , ...), é muito difícil entender o que significa o coeficiente de correlação. O rastreamento de qual variável contribui com o que a correlação não é tão claro.

Este é o lugar onde o $R^{2}$ $R^2$ valor entra em jogo. É simplesmente o quadrado do coeficiente de correlação. Leva valores entre $0$ $0$ e $1$ $1$ , onde valores próximos a $1$ $1$ implicam mais correlação (correlacionada positiva ou negativamente) e $0$ $0$ não implica correlação. Outra maneira de pensar nisso é como a variação fracionária na variável dependente que é o resultado de todas as variáveis independentes. Se a variável dependente for altamente dependente de todas as suas variáveis independentes, o valor estará próximo de $1$ $1$ . Assim $R^{2}$ $R^2$ é muito mais útil, pois também pode ser usado para descrever modelos multivariados.

Se você quiser discutir algumas das noções matemáticas envolvidas na relação dos dois valores, consulte esta .