O que é Machine Learning

Saiba o que é o conceito de machine learning ou aprendizado de máquina e como está sendo empregado na análise de dados


Machine Learning ou aprendizado de máquina é uma categoria de algoritmo que permite que os aplicativos de software se tornem mais precisos na previsão de resultados sem serem explicitamente programados. A premissa básica do aprendizado de máquina é construir algoritmos que possam receber dados de entrada e usar a análise estatística para prever uma saída enquanto atualiza as saídas à medida que novos dados se tornam disponíveis.

 

O aprendizado de máquina possui 3 principais classes de algoritimos

 

Supervised Learning

O aprendizado supervisionado (supervised learning) é o paradigma mais popular para o aprendizado de máquina. É o mais fácil de entender e o mais simples de implementar.  Na posse de dados na forma de exemplos com rótulos (labels) e caraterísticas (features), podemos alimentar um algoritmo de aprendizado com esses pares de rótulos de exemplo, um por um, permitindo que o algoritmo preveja o rótulo para cada exemplo e fornecendo feedback sobre se ele previu a resposta correta ou não. Com o tempo, o algoritmo aprenderá a aproximar a natureza exata do relacionamento entre exemplos e seus rótulos. Quando totalmente treinado, o algoritmo de aprendizado supervisionado poderá observar um novo exemplo nunca antes visto e prever um bom rótulo para ele.

O aprendizado supervisionado é frequentemente descrito como orientado a tarefas por causa disso. Ele é altamente focado em uma tarefa singular, fornecendo cada vez mais exemplos ao algoritmo até que ele possa executar com precisão essa tarefa. Alguns aplicações típicas para este tipo de aprendizado são:

  • Reconhecimento de facial
  • Seleção de anúncios
  • Tarefas de classificação em geral
  • Detecção de placas de trânsito
  • Carros Autônomos

 

Aprendizado Não Supervisionado

O aprendizado não supervisionado (unsupervised learning) é praticamente o oposto do aprendizado supervisionado. Os dados para treinamento não possui rótulos. Em vez disso, o algoritmo receberia dados e as ferramentas necessárias para entender as propriedades dos dados. A partir daí, ele pode aprender a agrupar e / ou organizar os dados de maneira que um humano (ou outro algoritmo inteligente) possa entender os dados recém-organizados.

O que torna a aprendizagem não supervisionada uma área tão interessante é que a esmagadora maioria dos dados disponivels normalmente não possuem rótulos. Ter algoritmos inteligentes que podem pegar terabytes e terabytes de dados não rotulados e compreendê-los é uma enorme fonte de lucro potencial para muitos setores. Só isso poderia ajudar a aumentar a produtividade em vários campos.
Por exemplo, e se tivéssemos um grande banco de dados de todos os trabalhos de pesquisa já publicados e tivéssemos algoritmos de aprendizado não supervisionados que soubessem agrupá-los de tal maneira que você estivesse sempre ciente da progressão atual em um domínio específico da pesquisa. Agora, você começa a iniciar um projeto de pesquisa, conectando seu trabalho a essa rede que o algoritmo pode ver. À medida que você redige seu trabalho e faz anotações, o algoritmo faz sugestões sobre trabalhos relacionados, trabalhos que você pode citar e trabalhos que podem até ajudá-lo a impulsionar esse domínio de pesquisa. Com essa ferramenta, sua produtividade pode ser extremamente aumentada.
Como o aprendizado não supervisionado se baseia nos dados e em suas propriedades, podemos dizer que o aprendizado não supervisionado é orientado por dados. Os resultados de uma tarefa de aprendizagem não supervisionada são controlados pelos dados e pela forma como eles são formatados. Algumas áreas que possuem potencial para aprendizado não supervisionado são:

  • Identificação de hábitos de compra
  • Sistemas de recomendação
  • Identificação de grupos semelhantes

 

Aprendizagem por Reforço

O aprendizado por reforço (reinforcement learning) é bastante diferente quando comparado ao aprendizado supervisionado e não supervisionado. Onde podemos ver facilmente o relacionamento entre supervisionado e não supervisionado (a presença ou ausência de rótulos), o relacionamento com o aprendizado por reforço é um pouco menos claro. Algumas pessoas tentam associar o aprendizado por reforço mais próximo dos dois, descrevendo-o como um tipo de aprendizado que depende de uma sequência de rótulos dependente do tempo, no entanto, minha opinião é que isso simplesmente torna as coisas mais confusas.
Prefiro considerar o aprendizado por reforço como aprendendo com os erros. Coloque um algoritmo de aprendizado por reforço em qualquer ambiente e ele cometerá muitos erros no começo. Desde que forneçamos algum tipo de sinal ao algoritmo que associa bons comportamentos a um sinal positivo e maus comportamentos a um negativo, podemos reforçar nosso algoritmo para preferir bons comportamentos a maus. Com o tempo, nosso algoritmo de aprendizado aprende a cometer menos erros do que costumava. Gosto de associar este classe de algoritmos com a maneira como aprendemos na infância a maior parte do aprendizado é obtido através da tentativa e erro

Aplicações típicas de reinforcement learning:

  • Simulação industrial
  • Videogames
  • Robótica

 

Conclusão

Mesmo se nunca criarmos um sistema de aprendizado de máquina nosso mundo está mudando drasticamente, com o aprendizado de máquina se tornando cada vez mais predominante em tudo o que usamos todos os dias. Compreender estes fundamentos nos ajudará a navegar neste mundo, desmistificando o que pode parecer um conceito elevado e permitindo-nos raciocinar melhor sobre a tecnologia que usamos.

 


 

Se Inscreva Na Nossa Newsletter Tenha Acesso Aos Melhores Artigos