Assistente de estudos com IA

Autores

  • Guilherme Campos Silva
  • Egon Luiz Müller Júnior
  • João Gabriel Miguêz da Silva
  • Júlia Pivato de Oliveira
  • Maria Fernanda Guimarães Soares

Palavras-chave:

Assistente de estudos, geração aumentada por recuperação, embeddings semânticos, indexação vetorial

Resumo

O trabalho confirmou a viabilidade de um assistente de estudos baseado em RAG capaz de entregar respostas coerentes, rastreáveis e alinhadas ao material-fonte. A solução construída — extração com PyMuPDF, segmentação em chunks, embeddings com SentenceTransformer (all-MiniLM-L6-v2), indexação FAISS (IndexFlatL2), geração com o LLM Mistral via Ollama e interface em Streamlit— demonstrou boa usabilidade: recupera trechos semanticamente relevantes, reduz o tempo de busca e mitiga “alucinações” ao sempre referenciar as fontes. Ao mesmo tempo, evidenciou limites práticos: depende de PDFs com texto extraível, pode fragmentar ideias por usar chunks fixos e seu desempenho está condicionado à cobertura e qualidade do acervo.
Para evoluir o sistema, recomendamos incorporar OCR e análise de layout para documentos digitalizados; adotar chunking adaptativo com sobreposição e um reranqueador (ex.: cross-encoder) para aumentar a precisão; incluir verificações de fidelidade (checar citação/trecho antes de responder) e métricas de avaliação (fidelidade, cobertura de citações, tempo de resposta); implementar cache e atualização incremental do índice com controles de acesso/privacidade; e ampliar o suporte a figuras, tabelas e múltiplos idiomas.

Downloads

Publicado

03.02.2026