Logo PUCPR

CONCATENAÇÃO DE VARIÁVEIS PARA CLASSIFICAÇÃO DE SÉRIES MULTIVARIADAS

FAISST, Alexandre de Freitas ¹; SOUZA, Vinicius Mourao Alves de ²
Curso do(a) Estudante: Ciência da Computação – Escola Politécnica – Câmpus Curitiba
Curso do(a) Orientador(a): Ciência da Computação – Escola Politécnica – Câmpus Curitiba

INTRODUÇÃO: Séries temporais são registros medidos ao longo do tempo e que se manifestam em diferentes contextos, desde sequências mensais da quantidade de produtos enviados por uma fábrica até observações diárias de casos de COVID-19 em um país. Em alguns problemas, são observadas múltiplas variáveis de interesse simultâneamente, gerando o que se denomina de séries temporais multivariadas. Ao lidar com dados multivariados em tarefas como classificação utilizando modelos de Aprendizagem de Máquina, é interessante considerar a correlação entre as diferentes variáveis no tempo, dado que séries temporais multivariadas são influenciadas não apenas por seus próprios valores, mas também pelas observações de outras variáveis. OBJETIVOS: O objetivo deste trabalho é investigar o problema de classificação de séries temporais multivariadas a partir da transformação desses dados em representações visuais que permitam a extração de informações adicionais, levando ao aumento do poder preditivo do modelo de classificação. Além de explorar tais representações, este trabalho também tem como objetivo investigar estratégias para concatenar as diferentes variáveis das séries em uma única representação que será utilizada como entrada para o modelo. MATERIAIS E MÉTODO: Foram consideradas seis representações visuais de séries temporais: CWT (Continuous Wavelet Transform), RP (Recurrence Plot), MTF (Markov Transition Field), GASF (Gramian Angular Summation Field), GADF (Gramian Angular Difference Field) e FIRTS (Fusion of Image Representations for Time Series). Na etapa de concatenação de variáveis, foram investigadas duas estratégias: pre-transform, onde as séries das diferentes variáveis são concatenadas antes da transformação em imagens, e post-transform, onde a concatenação das diferentes variáveis ocorre após a transformação individual de cada variável em imagem. RESULTADOS: Em uma avaliação experimental com 27 conjuntos de dados de benchmark, observou-se que estratégia do pre-transform foi a que obteve os maiores resultados médios de acurácia com 0.6293, enquanto a estratégia do post-transform obteve uma média de 0.5933. Em relação às representações visuais, a GADF alcançou o melhor desempenho médio, com acurácia de 0.6489, seguido pela FIRTS (0.6466) e CWT (0.6304). CONSIDERAÇÕES FINAIS: Os resultados indicam que a combinação adequada entre técnica de concatenação e representação visual tem um impacto significativo na acurácia dos classificadores. Embora a abordagem seja promissora, nota-se um alto custo computacional na etapa de geração de imagens que pode ser proibitiva em casos com um elevado número de exemplos. Por fim, esse trabalho pode ser utilizado como base para projetos futuros que venham a estudar o impacto dessas estratégias com outros modelos de classificação, como de Aprendizagem Profunda.

PALAVRAS-CHAVE: Séries temporais; Classificação; Representações visuais; Dados multivariados; Aprendizado de máquina.

APRESENTAÇÃO EM VÍDEO

Legendas:
  1. Estudante
  2. Orientador
  3. Colaborador
Esta pesquisa foi desenvolvida com bolsa PUCPR no programa PIBIC.

QUERO VOTAR NESTE TRABALHO

Para validarmos seu voto, por favor, preencha os campos abaixo. Alertamos que votos duplicados ou com CPF inválido não serão considerados.