Como atualizar um modelo (regressão ou classificação) com novos dados em Python
I estava em uma posição similar a você não faz muito tempo. Assumindo que você também tem alguma experiência SQL de seus estudos e trabalhos anteriores, eu recomendaria o seguinte:
- Download e instalar a distribuição Anaconda do Python, it'incluirá uma instalação base com muitos pacotes úteis. Se você'estiver confortável na linha de comando ou gostar de se jogar no fundo do poço, você poderia olhar para o Docker como uma alternativa e usar uma imagem do Anaconda. Anaconda and Docker - Better Together for Reproducible Data Science
- Explorar alguns cadernos Jupyter introdutórios e familiarizar-se com Pandas para manipulação de dados, plotting com matplotlib/seaborn e aprendizado de máquina com Scikit-learn/xgboost. Um bom lugar para começar seria aqui - Top 10 IPython Notebook Tutorials for Data Science and Machine Learning>li>Considerando que você tem experiência em estatística inferencial, aprender estatísticas Bayesianas em Python adicionará mais poder de fogo em sua caixa de ferramentas. PyMC é um bom lugar para começar ou simplesmente ir ao Google Python Bayesian statistics para mais detalhes.
- Look into ODBC and other connections to wherever your data lives so you can interact directly with your data without lots of pulling and writing data from A to B. Pyodbc é um bom lugar para começar a procurar.
- Quando você chegar até aqui, concentre-se no que você acha que será útil nos seus trabalhos prosepctive ou no que realmente lhe interessa. Isto pode ser um estudo adicional em algoritmos específicos de aprendizagem de máquina divididos por caso de uso (regressão, classificação, clustering, detecção de anomalias, sistemas de recomendação, etc.) ou experimentação de aprendizagem de máquina ou dashboarding e dados interativos, por exemplo, usando Plotly, D3.js, Tableau ou análise gráfica ou aprendizagem profunda ou raspagem da web ou uma das muitas outras coisas no campo brilhantemente amplo da ciência dos dados.
Data science é uma daquelas coisas em que você realmente tira o que você coloca dentro. Simplificando - quanto mais inteligente e mais difícil você trabalhar, mais altos serão os seus retornos. Como você'já está fazendo grandes perguntas aqui, eu aposto que você'já está no caminho certo. Tudo de bom e continue com o bom trabalho!