Ads Top

5 razões para aprender H2O

H2O é a biblioteca de aprendizado de máquina de código aberto e escalável que apresenta o AutoML. Aqui estão cinco razões pelas quais é uma biblioteca essencial para a criação de código de ciência de dados de produção.


Este artigo faz parte de uma série sobre habilidades essenciais em ciência de dados e aplicativos da Web para 2020.

Antes de eu entrar no H2O, vamos primeiro entender a demanda por ML. As tendências de 5 anos nas ofertas de emprego em tecnologia mostram um aumento de 440% nas habilidades de "Machine Learning" sendo solicitadas, capturando uma participação de 7% em todas as ofertas de emprego relacionadas à tecnologia.

Não apenas trabalhos de "cientista de dados" ... TODOS os trabalhos de tecnologia.

Top 20 Tech Skills 2014-2019
Source: Indeed Hiring Lab.

O que quero dizer: aprender ML é essencial


Podemos dizer com segurança que, se você trabalha em tecnologia (ou procura um emprego nesta área), precisa aprender como aplicar a IA e o Machine Learning para resolver problemas de negócios.

O problema: há uma dúzia de estruturas de aprendizado de máquina e aprendizado profundo - TensorFlow, Scikit-Learn, H2O, MLR3, PyTorch,… Tudo isso leva tempo e esforço para aprender. Então, qual estrutura você deve aprender para os negócios?

Por que eu uso e recomendo o H2O: O H2O produziu resultados sozinho em horas que, de outra forma, levariam dias ou semanas. Eu recomendo o aprendizado de H2O para aplicar o Machine Learning aos dados corporativos. Uso o H2O há vários anos, tanto em projetos de consultoria quanto em ensino aos clientes. Tenho 5 razões que explicam como obtive esse aprimoramento de produtividade usando H2O em meus projetos de negócios.

5 Razões pelas quais eu uso e ensino H2O

1 - AutoML - Aumento maciço da produtividade

O H2O AutoML automatiza o fluxo de trabalho de aprendizado de máquina, que inclui treinamento e ajuste automáticos de muitos modelos. Isso permite que você gaste seu tempo em tarefas mais importantes, como a engenharia de recursos e a compreensão do problema.

2 - Escalável na computação local


O processamento distribuído na memória acelera os cálculos.

O processamento na memória com serialização rápida entre nós e clusters para oferecer suporte a conjuntos de dados maciços permite que problemas que tradicionalmente precisam de ferramentas maiores sejam resolvidos na memória no computador local.

3 - Integração Spark e suporte a GPU - Big Data



O resultado é um treinamento 100x mais rápido que o ML tradicional.

4 - Melhores Algoritmos, Otimizados e Conjuntos - Performance superior

Os algoritmos de H2O são desenvolvidos desde o início para computação distribuída. Os algoritmos mais populares são incorporados, incluindo:

  • XGBoost
  • GBM
  • GLM
  • Random Forest
  • e mais.

O AutoML agrupa (combina) esses modelos para fornecer desempenho superior.

5 - Pronto para produção - Docker

Adoro usar o Docker + H2O para integrar modelos AutoML em aplicativos da Web brilhantes. O H2O é construído (e depende) do Java, que tradicionalmente cria sobrecarga. Mas, com o H2O Docker Images, facilita a implantação de modelos H2O com todo o software necessário dentro da imagem do Docker pré-criada.

Saiba mais sobre o H2O.


Nenhum comentário:

Tecnologia do Blogger.