Deep learning vs Machine learning vs IA: você sabe a diferença?
Entender a relação entre deep learning vs machine learning é crucial para a evolução em Data Science.
Deep learning vs machine learning: qual é melhor? Existe um melhor? Como avaliar? Você provavelmente já conhece esses conceitos e sabe como eles são extremamente confundidos na área de Data Science. Para o público geral, trata-se apenas de duas formas de se referir à mesma coisa. Contudo, eles carregam algumas diferenças bem interessantes que vale a pena conhecer.
Se você deseja ingressar no universo da Ciência de Dados, terá que frequentemente utilizar machine learning (ML) e deep learning (DL) em seus projetos. Eles são como ferramentas: cada um é perfeito para um determinado uso. Nesse sentido, é interessante conhecer suas diferenças e saber como se relacionam com a ideia de Inteligência artificial.
Pois, não precisa se preocupar! Neste artigo, explicaremos com detalhes as diferenças entre essas concepções para que você não se confunda mais e, inclusive, consiga explicar para outras pessoas. Acompanhe!
Deep learning e Machine Learning são a mesma coisa?
Primeiramente, vamos tratar da pergunta principal. Não, os dois conceitos não representam a mesma coisa. Deep learning pode ser compreendido como uma técnica dentro da noção de machine learning, como uma evolução do ML para projetos mais robustos - que veremos em detalhes mais à frente.
Afinal, DL é um conceito recente e está no auge agora. Vemos muitas pessoas procurando aprender os conceitos, estudando e tentando assimilar como funcionam os algoritmos principais. A tendência é que ele continue evoluindo, visto que já tem gerado resultados incríveis para empresas e pesquisadores.
Nos próximos tópicos, vamos especificar as diferenças entre cada um deles a partir da definição de cada um em específico.
Entendendo o que é Machine Learning
Comecemos com o Machine Learning. Trata-se de uma definição geral da noção de aprendizado de máquina. Consiste basicamente em tornar os computadores inteligentes e autônomos a partir do treinamento deles com dados em grande quantidade — o que pode ser o famoso Big Data.
É um raciocínio semelhante a processos que humanos realizam em muitas situações. Quando precisamos dominar um assunto, pesquisamos o máximo possível, lemos livros e assistimos a vídeos. Ou seja, preenchemos nossa memória com dados e mais dados acerca daquele tema para que sejamos capazes de aprender.
O machine learning é basicamente a máquina processando os dados e buscando padrões, correlações e tendências neles para poder de fato aprender sobre eles. Então, a máquina fornece uma resposta para os humanos acerca do que aprendeu. Informamos ao computador um conjunto de dados de entrada e esperamos uma saída correspondente que demonstra o que ele aprendeu.
Podemos dividir o ML em pelo menos dois tipos: aprendizado supervisionado e não supervisionado.
No aprendizado supervisionado, a pessoa cientista de dados ajuda o computador a entender quais são as saídas possíveis associadas às possíveis entradas em uma base de treinamento, como é chamado. Ou seja, é informado o conjunto de entradas com suas saídas. Então, depois do processo de treinamento, testamos o algoritmo com dados novos de entrada para verificar o que ele aprendeu.
Por exemplo, passamos um conjunto de dados que descrevem as características de um cachorro em uma foto e também mostramos ao computador se aquelas características são de um cachorro ou não em cada linha da tabela dos dados. Então, o computador deverá entender como aquelas variáveis se relacionam para gerar aquelas saídas a partir de cálculos persistentes e repetitivos.
Posteriormente, enviamos uma imagem nova de um cachorro e pedimos ao computador para dizer se é ou não, com base no que ele já tinha aprendido.
O outro tipo é o aprendizado não supervisionado. Dessa vez, a pessoa programadora não supervisiona o algoritmo, mas somente envia os dados para que ele tente entender seus padrões e correlações sozinho. Nesse sentido, o algoritmo vai tentar processar os dados em busca de insights que serão informados como saída.
Um exemplo é uma base de dados com os clientes de uma empresa. Ao enviar para o algoritmo de ML para agrupamento, o sistema consegue identificar grupos distintos de clientes com características similares. Assim, é possível realizar ações de marketing específicas para cada grupo.
Na categoria dos modelos supervisionados, temos problemas de classificação (predição se algo se encaixa em uma categoria ou em outra, como no caso do cachorro) e regressão (prediz um determinado valor). Na categoria dos não supervisionados, temos agrupamento, detecção de desvios, associação e outros.
E Deep Learning, o que é?
No ML, temos diversos algoritmos e técnicas que são sempre associados a determinados problemas. Por exemplo, se o objetivo é classificar algo, temos o naive-bayes ou a árvore de decisão. Contudo, há alguns problemas mais complexos que não são facilmente relacionados com métodos específicos de resolução.
Aí entram as redes neurais artificiais, que simulam o aprendizado dos neurônios humanos. Envolvem nós que processam os dados e emitem uma opinião específica acerca de uma parte desses dados. Esses nós fazem parte de uma camada. Quando uma rede neural possui múltiplas camadas, chamamos de rede neural profunda ou de deep learning.
O deep learning simula o aprendizado humano por camadas. Quando olhamos uma foto, por exemplo, uma parte do nosso cérebro se concentra na forma da imagem, outra nas bordas do objeto, outra tenta associar o objeto como um todo com algo já existente em nossa memória.
No DL, cada camada processa uma parte do cenário que foi dado como entrada. Cada nó contribui de alguma forma com um processamento e cada camada é mais especialista que a anterior, partindo de onde a anterior parou. Então, a entrada vai sendo analisada por cada camada e sendo compreendida aos poucos pela rede neural. Ao final, temos o resultado.
Pode ser um problema de classificação: determinar se um exame médico indica uma doença ou não. Geralmente, o reconhecimento de imagens é uma situação clássica para o deep learning. Outro caso clássico é o processamento de linguagem natural, que envolve os chatbots, por exemplo.
A grande diferença do deep learning — e o que torna seus resultados melhores — é o fato de que ele automatiza uma parte do aprendizado: a extração de características. Por exemplo, se você passa para um algoritmo de ML a imagem de um carro, precisará informar as características que compõem todos os carros: janelas, vidros, rodas, portas etc.
Caso você dê esse problema a um algoritmo de DL, ele mesmo, por conta de sua rede de camadas profundas, vai se encarregar de extrair essas características.
Fonte da imagem: Towards Data Science
Por fim, qual a relação entre Deep Learning, Machine Learning e Inteligência Artificial?
Vamos então resumir o que foi visto. O deep learning é uma técnica para aprendizado profundo, com base em camadas especialistas e em interação entre essas camadas (uma passa informação para outras). O DL é um dos métodos utilizados no universo do aprendizado de máquina, ou machine learning.
Por sua vez, o machine learning é uma subárea da inteligência artificial (IA), campo maior da computação que estuda como tornar os computadores inteligentes para determinadas tarefas desde os anos 50. O campo de IA inclui também noções como sistemas especialistas, IA forte e IA fraca, entre outras.
O machine learning é uma versão moderna de IA, que compõe praticamente a maioria das soluções atuais. É uma forma de IA mais avançada que as formas anteriores, que responde bem à grande quantidade de dados que é gerada atualmente. Ao passo que deep learning é ainda mais avançado que machine learning.
Quem é melhor entre Machine learning e Deep Learning? — você pode se perguntar. Ora, não existe melhor absoluto. ML é para problemas mais simples, em que se tem um algoritmo específico para o tipo de situação. Envolve uma quantidade grande de dados e componentes bem avançados de processamento e memória.
DL, por sua vez, é para problemas mais complexos, que envolvem conhecimento específico de outras áreas, como no caso de análise de exames médicos. Envolve uma quantidade enorme de dados e computação robusta, geralmente realizada com GPUs.
Então, o que vai determinar o uso de uma ou de outra técnica é o problema em questão. Usar DL para um problema de ML é um desperdício de recursos. Ao mesmo tempo, usar ML para um problema de DL vai gerar uma demora muito grande e pouca precisão.
….
Como vimos, na disputa deep learning vs machine learning, não há vencedores absolutos. Devemos olhar o desafio dado e analisar cada caso em específico. Vale destacar também que ambas as áreas são fortemente amparadas em matemática avançada. Diversos algoritmos de ML são fundamentados em estatística — por isso é importante aprender sobre essa área também.