Machine Learning na Investigação de Dados: entenda!
O Machine Learning é uma das áreas de estudo da IA, possuindo o objetivo de desenvolver técnicas e implementar sistemas que consigam aprender com máquinas.(...)
Autor: Redação Impacta
Por Marino Catarino,
Uma das áreas de estudo da Inteligência Artificial é o Aprendizado de Máquina (Machine Learning). Essa área possui como um dos objetivos o desenvolvimento de técnicas e a implementação de sistemas que possam automatizar a forma de aprender e de obter conhecimento pelas máquinas.
O Machine Learning possui uma etapa inicial de testes na qual a máquina aprende a identificar padrões com coerência para poder então aplicar o conhecimento em novos conjuntos de dados.
Nessa etapa é que se define o que pretende pesquisar ou analisar e, quanto mais elaborada, os resultados obtidos ao solucionar novos problemas similares serão muito melhores.
Outro fenômeno que temos é o Big Data, que é o termo utilizado para descrever os volumes imensos de dados que geramos constantemente.
Devido aos avanços tecnológicos, as técnicas de Machine Learning podem ser aplicadas de forma eficiente nos grandes volumes de dados, ou seja, temos uma situação oportuna de aprender de forma mais rápida através desses dados e extrair valor da informação disponível.
As possibilidade de uso das técnicas de Machine Learning são ilimitadas, podendo ser mencionado:
- detecção de fraudes no setor financeiro;
- identificação de têndencias no setor de comércio;
- em estudos para detecção e prevenção de problemas de saúde e na prevenção de crimes – área em que estudos recentes evidenciaram que crime é um conjunto de padrões que podem ser estudados e previstos.
Machine Learning Superviosado X Não-Supervisionado: qual a diferença?
Existem duas divisões iniciais das formas pela qual a máquina pode aprender: aprendizado de máquina supervisionado e aprendizado de máquina não supervisionado.
No Machine Laerning supervisionado ela busca responder uma questão em específico, uma variável a ser respondida. Já o Machine Learning não supervisionado não possui uma questão em específico, mas sim procura identificar grupos ou padrões a partir dos dados, de uma forma automática.
Vamos ver cada um deles a seguir:
- Aprendizado de máquina supervisionado
O aprendizado supervisionado utiliza supervisores para prever uma variável dependente, a partir de um conjunto de variáveis independentes. Por exemplo, uma empresa do setor de comércio deseja saber qual açõa de marketing resultou em um melhor retorno.
Nesse exemplo a variável dependente é o número de vendas e as variáveis independentes são as demais informações que se encontram disponíveis nos dados.
Os algoritmos de aprendizado supervisionado podem ser ser divididos em:
- Regressão: analisam como uma variável evolui com relação as demais variáveis. Por exemplo, utilizando como entrada a imagem de uma pessoa, identificar a idade dela.
- Classificação: analisam uma entrada, classificando-a em que grupo ou divisão se encaixa. Por exemplo, utilizando como entrada a imagem de uma pessoa, deve-se identificar se ela é do gênero masculino ou feminino.
Muitos dos algoritmos de Machine Learning são supervisionados, sendo os mais comuns o Classificador Naive Bayes, a Rede Neural Artificial (RNA) e as Máquinas de Vetor de Suporte (SVM).
- Aprendizado de máquina não-supervisionado
Enquanto que o aprendizado supervisionado possui as variáveis bem definidas, o aprendizado não-supervisionado segue outra proposta. Esse modelo tem a finalidade de auxiliar quando queremos encontrar quais são os padrões e relações existentes em um conjunto de dados de forma automática.
Nesse tipo de situação podemos analisar problemas tendo pouca ou nenhuma idéia sobre a relação das variáveis.
Por exemplo encontrar uma forma de agrupar automaticamente todas as monografias existentes de uma universidade que possuem algum tipo de relacionamento entre si, como número de páginas, ou frequência das palavras.
A clusterização k-médias e a clusterização Hierárquica são exemplo de aprendizagem não-supervisionada.
A forma como o Machine Learning vai ser utilizado dependerá do problema que pretende estudar. Não existem garantias de que, ao aplicar a técnica mais adequada em um conjunto de dados, o resultado obtido será satisfatório.
Muito de sua inteligência se encontra na parte do “ensinar” a máquina a fazer o que se espera que ela faça, e para isso, é necessário que o “professor” saiba definir muito bem o que se pretende analisar e como chegar ao resultado desejado. A máquina se encontra a disposição para aprender, basta então saber ensinar.
Curtiu o post? Deixe seu comentário nos contando se já sabia que o Machine Learning poderia ser utilizado na investigação de dados ou caso tenha ficado alguma dúvida sobre o conteúdo!
1 Comentário
Deixe o seu comentário!