Como se tornar um analista de dados
Se você é de uma formação em estatística ou matemática, então o processo não será tão brutal como é para mim (tenho um bacharelado em Administração de Empresas e um mestrado em Negócios Internacionais).
Eu nunca tive realmente um interesse em assuntos STEM e na verdade procurei ativamente evitá-los, pois estava muito mais interessado em Gestão e Marketing na Universidade, e por um tempo isso não causou nenhum problema na minha carreira, pois fui capaz de conseguir um emprego como consultor de gestão/marketing/marca. Quando me juntei ao meu trabalho atual como consultor em uma empresa de consultoria que faz análise de dados e Machine Learning como parte central de seu trabalho, foi quando a minha aversão a assuntos STEM veio para me morder o rabo. Eu tinha um entendimento absolutamente zero do que eu estava fazendo no trabalho, tanto em termos teóricos (as teorias por trás de vários modelos de aprendizagem de máquinas, por exemplo, Gradient Boosting, Logistic Regression etc.) e práticos (implementar os modelos usando linguagens como SAS, SQL, Python, Xpress Mosel). Eu tinha e ainda tenho muito a fazer em ambos os departamentos, mas o problema é o seguinte: até mesmo caras da STEM tiveram problemas com o trabalho, pelo menos no início. A diferença entre mim e eles se manifestava principalmente na facilidade com que eles eram capazes de pegar coisas novas por causa de suas bases mais fortes em comparação com alguém como eu que nem sequer tem bases para começar.
A primeira coisa que você precisaria é conhecimento. Aprendizagem mecânica ou até mesmo apenas Análise de Dados requer um forte background em estatísticas para que eu comece a partir daí. As escolhas de linguagem de programação não são feitas em pedra, então dependendo da indústria você pode ou não estar usando as linguagens mais populares disponíveis. Comece com SQL, pois é praticamente universal e expanda para R ou Python. Eu pessoalmente recomendo ir para Python primeiro, uma vez que é muito mais fácil de pegar do que as alternativas. Python também tem a vantagem de ser uma linguagem multifuncional que pode ser usada em muitas situações diferentes como desenvolvimento web, desenvolvimento de jogos, hobbies (por exemplo, Lego Mindstorms) e desenvolvimento de software além da Análise de Dados, assim no caso de você decidir ir para outros campos além da Análise de Dados você será capaz de transferir seus conhecimentos em codificação até certo ponto. Se você está procurando ir para as áreas de Finanças ou Medicina, você também pode precisar de algum conhecimento sobre SAS. A boa notícia é que a codificação é relativamente simples em comparação com o conhecimento necessário para a Aprendizagem Automática, por isso não deve demorar muito tempo para você entender o básico. Basta lembrar que a Data Science/Analysis requer muito estudo para se tornar proficiente em.