DELIMITANDO O ESTADO-DA-ARTE PARA MODELOS ENSEMBLES DE MINERAÇÃO DE FLUXOS DE DADOS
Introdução: A análise de grandes volumes de dados gerados continuamente, conhecida como mineração de fluxo de dados, é um campo de estudo cada vez mais importante na era digital. Os métodos tradicionais de análise de dados não são adequados para essa tarefa, pois os dados mudam constantemente e há limitações de tempo e memória para processá-los. Um problema central nessa área é a falta de uma maneira padronizada para testar e comparar os diferentes algoritmos, o que dificulta saber qual deles é o melhor para cada situação. Objetivos: Este trabalho buscou resolver essa questão por meio de uma avaliação detalhada de várias técnicas avançadas, chamadas de algoritmos de ensemble. O objetivo foi comparar o desempenho desses algoritmos de forma justa, usando um método de teste rigoroso em diferentes tipos de dados, tanto de situações reais quanto de cenários simulados. Materiais e método: Foram avaliados três aspectos principais: a precisão das previsões, a velocidade de processamento e a quantidade de memória utilizada. Os resultados mostraram que não existe um único algoritmo que seja o melhor em todas as situações. Resultados: A escolha ideal depende do que é mais importante para cada aplicação. Alguns algoritmos se mostraram muito precisos, conseguindo fazer previsões corretas na maioria das vezes, especialmente em dados complexos do mundo real, e ao mesmo tempo foram rápidos e não usaram muita memória. Outros foram extremamente rápidos, mas com uma precisão um pouco menor, sendo ideais para casos em que a velocidade é o fator mais crítico. Houve também algoritmos que se destacaram por usar pouquíssima memória, mas que em contrapartida eram muito lentos. Uma descoberta importante foi que o desempenho dos algoritmos em dados simulados nem sempre foi o mesmo que em dados reais. Alguns que eram ótimos nos testes controlados não se saíram bem em cenários práticos, e vice-versa. Isso mostra que a complexidade e as imperfeições dos dados do mundo real têm um grande impacto no funcionamento dos algoritmos. Considerações finais: Este estudo demonstra que a escolha de uma técnica para mineração de fluxo de dados envolve uma série de compromissos entre precisão, velocidade e uso de recursos. Não há uma solução única que sirva para todos os problemas. A análise revelou que o desempenho em ambientes ideais de laboratório pode não se traduzir em eficácia no mundo real, destacando a importância de realizar testes em contextos práticos para entender a verdadeira capacidade de um algoritmo. A pesquisa indica que o caminho para o avanço na área está em compreender essa relação de troca e desenvolver abordagens mais flexíveis e robustas, capazes de se adaptar aos desafios dinâmicos dos fluxos de dados.
Palavras-chave: Mineração de Fluxo de Dados; Algoritmos de Ensemble; Concept Drift; Avaliação Experimental; Análise Comparativa de Algoritmos.
Para validarmos seu voto, por favor, preencha os campos abaixo. Alertamos que votos duplicados ou com CPF inválido não serão considerados.