5 razões para aprender H2O
H2O é a biblioteca de aprendizado de máquina de código aberto e escalável que apresenta o AutoML. Aqui estão cinco razões pelas quais é uma biblioteca essencial para a criação de código de ciência de dados de produção.
Este artigo faz parte de uma série sobre habilidades essenciais em ciência de dados e aplicativos da Web para 2020.
Antes de eu entrar no H2O, vamos primeiro entender a demanda por ML. As tendências de 5 anos nas ofertas de emprego em tecnologia mostram um aumento de 440% nas habilidades de "Machine Learning" sendo solicitadas, capturando uma participação de 7% em todas as ofertas de emprego relacionadas à tecnologia.
Não apenas trabalhos de "cientista de dados" ... TODOS os trabalhos de tecnologia.
Podemos dizer com segurança que, se você trabalha em tecnologia (ou procura um emprego nesta área), precisa aprender como aplicar a IA e o Machine Learning para resolver problemas de negócios.
O problema: há uma dúzia de estruturas de aprendizado de máquina e aprendizado profundo - TensorFlow, Scikit-Learn, H2O, MLR3, PyTorch,… Tudo isso leva tempo e esforço para aprender. Então, qual estrutura você deve aprender para os negócios?
Por que eu uso e recomendo o H2O: O H2O produziu resultados sozinho em horas que, de outra forma, levariam dias ou semanas. Eu recomendo o aprendizado de H2O para aplicar o Machine Learning aos dados corporativos. Uso o H2O há vários anos, tanto em projetos de consultoria quanto em ensino aos clientes. Tenho 5 razões que explicam como obtive esse aprimoramento de produtividade usando H2O em meus projetos de negócios.
Este artigo faz parte de uma série sobre habilidades essenciais em ciência de dados e aplicativos da Web para 2020.
Antes de eu entrar no H2O, vamos primeiro entender a demanda por ML. As tendências de 5 anos nas ofertas de emprego em tecnologia mostram um aumento de 440% nas habilidades de "Machine Learning" sendo solicitadas, capturando uma participação de 7% em todas as ofertas de emprego relacionadas à tecnologia.
Não apenas trabalhos de "cientista de dados" ... TODOS os trabalhos de tecnologia.
Top 20 Tech Skills 2014-2019 Source: Indeed Hiring Lab. |
O que quero dizer: aprender ML é essencial
Podemos dizer com segurança que, se você trabalha em tecnologia (ou procura um emprego nesta área), precisa aprender como aplicar a IA e o Machine Learning para resolver problemas de negócios.
O problema: há uma dúzia de estruturas de aprendizado de máquina e aprendizado profundo - TensorFlow, Scikit-Learn, H2O, MLR3, PyTorch,… Tudo isso leva tempo e esforço para aprender. Então, qual estrutura você deve aprender para os negócios?
Por que eu uso e recomendo o H2O: O H2O produziu resultados sozinho em horas que, de outra forma, levariam dias ou semanas. Eu recomendo o aprendizado de H2O para aplicar o Machine Learning aos dados corporativos. Uso o H2O há vários anos, tanto em projetos de consultoria quanto em ensino aos clientes. Tenho 5 razões que explicam como obtive esse aprimoramento de produtividade usando H2O em meus projetos de negócios.
5 Razões pelas quais eu uso e ensino H2O
1 - AutoML - Aumento maciço da produtividade
O H2O AutoML automatiza o fluxo de trabalho de aprendizado de máquina, que inclui treinamento e ajuste automáticos de muitos modelos. Isso permite que você gaste seu tempo em tarefas mais importantes, como a engenharia de recursos e a compreensão do problema.
2 - Escalável na computação local
O processamento distribuído na memória acelera os cálculos.
O processamento na memória com serialização rápida entre nós e clusters para oferecer suporte a conjuntos de dados maciços permite que problemas que tradicionalmente precisam de ferramentas maiores sejam resolvidos na memória no computador local.
3 - Integração Spark e suporte a GPU - Big Data
- A integração Spark do H2O (Sparkling Water) permite o processamento distribuído no Big Data.
- O H2O4GPU permite a execução das bibliotecas R e Python do H2O usando GPUs.
O resultado é um treinamento 100x mais rápido que o ML tradicional.
4 - Melhores Algoritmos, Otimizados e Conjuntos - Performance superior
Os algoritmos de H2O são desenvolvidos desde o início para computação distribuída. Os algoritmos mais populares são incorporados, incluindo:
- XGBoost
- GBM
- GLM
- Random Forest
- e mais.
O AutoML agrupa (combina) esses modelos para fornecer desempenho superior.
5 - Pronto para produção - Docker
Adoro usar o Docker + H2O para integrar modelos AutoML em aplicativos da Web brilhantes. O H2O é construído (e depende) do Java, que tradicionalmente cria sobrecarga. Mas, com o H2O Docker Images, facilita a implantação de modelos H2O com todo o software necessário dentro da imagem do Docker pré-criada.
Saiba mais sobre o H2O.
Nenhum comentário:
Postar um comentário