LattesRex: Building ChatBots for Semi-Structured Documents

Published: 2025, Last Modified: 11 Jan 2026STIL 2025EveryoneRevisionsBibTeXCC BY-SA 4.0
Abstract: Resumo Apresentamos o LattesRex, um sistema de perguntas e respostas baseado em LLMs para auxiliar na análise de currículos da Plataforma Lattes. Propomos uma abordagem estruturada modular inspirada em RAG, explorando metadados para estruturar as entradas enviadas à LLM. Conduzimos uma avaliação detalhada, com validação de linguistas, variando (i) o porte dos modelos, (ii) a extensão dos documentos e (iii) a complexidade das consultas. Os resultados indicam que a estruturação dos dados escala a solução sem perda de qualidade. Contribuímos com uma arquitetura replicável, uma avaliação qualitativa sistemática e reflexões relevantes para o uso de LLMs em contextos reais. Todos os recursos serão disponibilizados publicamente.
Loading