Dicas de SQL para cientistas de dados
Os cientistas/analistas de dados devem conhecer o SQL; de fato, todos os profissionais que trabalham com dados e anĂ¡lises devem conhecer o SQL. AtĂ© certo ponto, o SQL Ă© uma habilidade subestimada para a ciĂªncia de dados, porque foi uma habilidade adquirida como necessĂ¡ria, porĂ©m nĂ£o-legal, de extrair dados do banco de dados para alimentar o pandas e formas mais sofisticadas de organizar seus dados.
No entanto, com dados massivos sendo coletados e gerados todos os dias nos setores, desde que os dados residam em um banco de dados compatĂvel com SQL, o SQL ainda Ă© a ferramenta mais eficiente para ajudĂ¡-lo a investigar, filtrar e agregar para obter um entendimento completo de seus dados. Ao fatiar e filtrar com o SQL, os analistas podem identificar padrões que merecem uma anĂ¡lise mais aprofundada, o que muitas vezes leva a redefinir a populaĂ§Ă£o de anĂ¡lise e as variĂ¡veis a serem consideravelmente menores (que o escopo inicial).
Portanto, em vez de transferir grandes conjuntos de dados para Python ou R, a primeira etapa da anĂ¡lise deve ser o SQL para obter informações informativas de nossos dados.
Leia o artigo completo em: https://intelekts.com.br/6-truques-de-sql-que-todo-cientista-de-dados-deve-saber/
Nenhum comentĂ¡rio:
Postar um comentĂ¡rio