Desmitificando a programação em machine learning

Dirigir, investir, detectar fraudes, classificar doenças e criar medicamentos. Há pouco tempo essas atividades eram feitas somente por seres humanos. Hoje, com o desenvolvimento de técnicas de aprendizado de máquina (machine learning, da sigla em inglês), podemos ensinar sistemas a executá-las com precisão igual – ou superior – a nossa.

Machine learning usa algoritmos para entender o modelo (a lógica, o padrão) que dá origem a um conjunto de dados para conseguir prever ou classificar novos valores.

A programação tradicional baseia-se em definir cada etapa que o programa deve executar para obter um resultado. Com machine learning, a ideia é fazer com que ele aprenda os passos necessários para isto.

A grande vantagem ocorre quando trabalhamos com problemas complexos, onde o algoritmo não é bem definido. Como identificar pessoas em uma foto. É muito difícil escrever um programa que faça isto bem feito, pois a variedade de cenários possíveis é muito grande. Existe uma infinidade de poses, locais, ângulos, iluminação e cores em uma foto. Preparar um algoritmo para trabalhar com todos estes cenários é muito trabalhoso. Com machine learning podemos ensinar o computador a fazer esta tarefa sem programar o passo-a-passo, apenas ensinando com base em exemplos.

Podemos separar os algoritmos de machine learning conforme seu tipo de aprendizagem, ou seja, a forma como aprendem.

Tipos de aprendizagem

Existem três principais categorias: aprendizagem supervisionada, não supervisionada e por reforço.

Aprendizagem Supervisionada

Imagine um programa que usa machine learning para identificar fotos de cachorros. Vou usar dois dados de entrada para treiná-lo:

Imagem: fotos variadas, algumas de cachorros, e outras não.
Boolean: um boolean que indica se a foto é ou não de um cachorro.

O treinamento ocorre quando o programa “vê” uma imagem junto com sua resposta, ou seja, esta imagem é de um cachorro? Imagine isto se repetindo para milhares de imagens diferentes. Chega um momento em que o programa identifica as características que fazem uma imagem ser a imagem de um cachorro.

Esta é a aprendizagem supervisionada: dizemos ao computador o que é cada entrada (qual o label) e ele aprende quais características daquelas entradas fazem elas serem o que são.

De acordo com o tipo de resultado do algoritmo, podemos classificá-lo entre algoritmo de classificação ou algoritmo de regressão.

O exemplo anterior é um exemplo de classificação. Estamos classificando uma entrada entre dois tipos possíveis: cachorro ou não-cachorro.

Já a regressão ocorre quando o resultado é numérico. Por exemplo, um programa que calcula o valor que uma casa deveria ter com base em características como número de quartos, localização e ano de construção. Com base em exemplos de casas similares, o computador aprende a precificar novas casas.

Aprendizagem Não Supervisionada

Nos três tipos de aprendizagem existe a semelhança do computador aprender a inferir algo com base em suas experiências passadas. A diferença da aprendizagem não supervisionada para a supervisionada é que aqui a aprendizagem ocorre com dados não rotulados, ou seja, não dizemos ao computador o que é aquela entrada.

Por exemplo, vamos imaginar uma distribuidora que quer classificar seus clientes em categorias. Ela cria um programa que usa aprendizagem não supervisionada para fazer isto. Ou seja, ela ensina a separar os dados em grupos semelhantes, sem dizer o que são estes grupos. Um possível resultado é um grupo de clientes que compram produtos frescos, e outro com clientes que compram produtos industrializados, por exemplo.

Da mesma forma com a classificação de imagens. Temos um modelo que aprendeu a classificar imagens entre dois grupos distintos. Ao receber uma nova imagem, com base em seus atributos, ele identifica a qual grupo ela pertence. Sem necessariamente saber o que é aquele grupo.

Aprendizagem Por Reforço

Fonte: tesla.com

A terceira classificação é a aprendizagem por reforço. Imagine criar um programa responsável por dirigir um veículo autônomo. Ele deve aprender a dirigir pelas ruas e transportar seus passageiros. Existem diversas formas de otimizar esta tarefa. Por exemplo, chegar ao destino no menor tempo possível e não causar nenhum acidente. Queremos que ele saiba o que fazer conforme o que ocorre à sua volta, e preferimos que ele demore um pouco mais do que causar um acidente, por exemplo. A aprendizagem por reforço é uma forma de ensinar ao computador qual ação priorizar dada uma determinada situação.

É possível vincular recompensas e punições aos possíveis resultados e, ponderando-as da forma certa, ensinar o nível de prioridade de cada meta. Neste exemplo, posso atribuir uma punição muito maior em caso de um acidente em comparação a se atrasar poucos minutos. Desta forma se ensina quais ações o computador deve priorizar.

Existem muitos detalhes que não foram cobertos por este artigo, porque a ideia foi iniciar o assunto para que possamos entender um pouco do que é machine learning e como é implementar programas que utilizam este recurso.

Além de conhecer as técnicas para criar programas que usam machine learning, é preciso também prestar atenção aos dados que serão utilizados para treinar estes programas. Grande parte do sucesso de um modelo vem da qualidade desses dados. É possível tratá-los utilizando técnicas de Análise de Dados.

Para saber mais detalhes de como programar com machine learning, basta acessar https://blog.db1.com.br/machine-learning/

——————–

Marcos Tanaka é desenvolvedor da DB1 Global Software. Gosta de implementar suas ideias criando software claro, simples e de fácil manutenção. Já desenvolveu projetos utilizando tecnologias como Java, Spring Framework, Hibernate, JavaScript, Node.js, Swift, iOS, Kotlin, Python e Machine Learning. Você pode encontrá-lo nas redes sociais com o usuário marcosatanaka, ou aqui: https://about.me/marcosatanaka

Desmitificando a programação em machine learning

Tipos de aprendizagem

Aprendizagem Supervisionada

Aprendizagem Não Supervisionada

Jurerê OPEN registra aumento de 200% no número de visitantes neste verão

“Histórias: Show do Século” anuncia data em Curitiba com grandes nomes do sertanejo

A elegância do campo britânico: tendência de decoração para 2025

Wesley Safadão volta ao Curitiba Country Festival para show inesquecível

Artigos Relacionados

Academia do Coração do Hospital Costantini ultrapassa 350 mil atendimentos

Centro de Diabetes Curitiba recruta voluntários para pesquisas

HNSG promove Serenata de Natal e toca os corações de pacientes e comunidade

Amigos do HC realiza venda de obras de arte em campanha beneficente

Destaque do Editor

Problemas de visão atingem 19% dos brasileiros em idade escolar

Onda de calor: quem tem doença crônica precisa redobrar os cuidados

UNIFAEL inaugura unidade com mais de 2.000 m² no Shopping Estação, com novos laboratórios e lançamento de cursos acadêmicos

Catamarã Floripa comemora dois anos de operação com expansão e novas experiências para turistas

Mais artigos do autor

SMA anuncia Alysson Camilo como Regional Sales Manager

A importância da análise em tempo real na prevenção de fraudes

Podcast da Treeunfe Celebra Empreendedorismo Feminino com Histórias Inspiradoras

A revolução da IA contra fraude fiscal e crimes financeiros

Elotech é certificada com Selo Ipê Branco, nível Prata, da categoria...

Onda de calor: quem tem doença crônica precisa redobrar os cuidados

Shopping Curitiba celebra o verão com campanha promocional

Com impacto emocional, alopecia areata ganha novas opções de tratamento

Carnaval do Warung Beach Club traz grandes nomes da música eletrônica internacional

Shopping Curitiba destina 65% dos seus resíduos para reciclagem e compostagem