Casa > O > O Que É Que ~ Significa Em R?

O que é que ~ significa em R?

Em geral, o til ('~') separa o lado esquerdo de uma fórmula com o lado direito da fórmula.

Por exemplo, numa função linear, separaria a variável dependente das variáveis independentes e pode ser interpretado como dizendo, "como uma função de". So, when calling the lm() command to create a linear model of a person’s wages as a function of their years of education, you'd do something like

  1. lm (wages ~ yearsEd, data = df) 

Where df is a dataframe that has the wages and yearsEd columns which, respectively, have the wages and the years of education of all the people in your sample. Você coloca a variável de resposta (dependente) em primeiro lugar e a(s) variável(s) explicativa(s) (independente(s) após o til. Note que o modelo acima pode ser descrito como um modelo linear dos salários de uma pessoa em função do número de anos de educação que ela recebeu.

Ao criar um gráfico de dispersão com base R, ele apenas permite especificar qual variável colocar no eixo y e qual colocar no eixo x. Por convenção, a variável de resposta vai no eixo y, então a variável antes do '~' se torna a variável y e a variável depois dela se torna a variável x.

So to make a scatterplot corresponding to the above linear model, you can pretty much use the same syntax and do:

  1. plot (wages ~ yearsEd, data = df) 

So, after you make a scatterplot and think you see a linear relationship, you can take advantage of R’s command history and use that up-arrow and just change the command from plot() to lm()!

Por favor note que várias funções e pacotes podem usá-lo de forma diferente. Por exemplo o ggplot2 usa-o para especificar a faceta de múltiplos gráficos ao longo dos eixos y e x, e pode haver outros.

Resposta atualizada para ser mais amplamente aplicável após grandes questões de Kiran Mahato e Diya Suresh nos comentários.

De Adair

O que é a MSME? :: O que significa seinen?