- O que muda no crédito e renegociação automatizada com RAG
- Onde o RAG entra na jornada
- Arquitetura prática para renegociação automatizada
- Regras antes do modelo
- Passo a passo em Python para um MVP
- Boas práticas de chunking
- Dados, governança e compliance na renegociação automatizada
- LGPD e minimização de dados
- Métricas para sair do piloto com segurança
- Teste A/B e amostragem
- Próximos passos para sair do protótipo
Crédito e renegociação automatizada com RAG virou uma rota prática para operações que precisam responder rápido, respeitar política interna e reduzir erro humano. Em vez de deixar o LLM improvisar, o sistema consulta contratos, tabelas de desconto, scripts de cobrança e regras de elegibilidade antes de propor um acordo.
Na prática, isso significa menos retrabalho e mais consistência. Um fluxo bem desenhado pode sugerir parcelamento, desconto ou carência com base em documentos reais, histórico do cliente e limites de aprovação. A seguir, veja a arquitetura, um exemplo em Python e o que medir para sair do piloto com segurança.
O que muda no crédito e renegociação automatizada com RAG
RAG, ou Retrieval-Augmented Generation, combina busca semântica com geração de texto. No crédito, isso resolve um problema clássico: o modelo precisa seguir regras muito específicas, e não apenas “parecer convincente”.
Um exemplo simples ajuda. Se a política permite 20% de desconto para atraso acima de 90 dias e 3 parcelas no máximo, o LLM deve consultar essa regra antes de redigir a oferta. Sem isso, a chance de gerar uma proposta fora da alçada cresce bastante. Em operações reguladas, esse detalhe faz diferença.
Onde o RAG entra na jornada
O fluxo costuma ter 4 etapas: ingestão de documentos, indexação vetorial, recuperação de trechos relevantes e geração da resposta. Em uma operação de cobrança, isso pode incluir contrato, aditivos, régua de cobrança, histórico de pagamento e scripts aprovados pelo jurídico.
Segundo a IBM, RAG melhora a precisão ao conectar o modelo a fontes externas atualizadas. Em crédito, essa atualização é essencial, porque política de desconto e alçada mudam com frequência.
Arquitetura prática para renegociação automatizada
Uma arquitetura enxuta já entrega valor. O desenho mínimo tem 5 blocos: document loader, chunking, vector store, retriever e LLM. Em um MVP, você pode usar PDFs de política, planilhas exportadas em texto e logs de atendimento.
Para o banco vetorial, opções comuns incluem FAISS, Chroma e pgvector. Para embeddings, modelos como text-embedding-3-small ou alternativas abertas ajudam a começar com custo controlado. Em produção, o ponto central é latência: muitos times buscam resposta abaixo de 2 segundos no atendimento assistido.
RAG não decide sozinho: ele organiza evidências para a renegociação ser mais segura e auditável.
Regras antes do modelo
Não deixe o LLM decidir elegibilidade. Primeiro aplique regras determinísticas. Exemplo: atraso mínimo, score mínimo, faixa de desconto, produto elegível e canal autorizado. Só depois o modelo redige a proposta. Esse filtro reduz risco operacional e facilita auditoria.
Um caso real recorrente em contact center é a oferta inconsistente entre operadores. Com RAG, o script recupera a política vigente e padroniza a resposta. O resultado não é apenas velocidade, mas também governança.
Passo a passo em Python para um MVP
A implementação pode ser feita em Python com LangChain ou LlamaIndex. Abaixo, um esqueleto simples para começar. O objetivo é recuperar trechos de política e gerar uma proposta de renegociação com base neles.
from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import FAISS
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
# 1. Carregar documentos
loader = PyPDFLoader("politica_renegociacao.pdf")
docs = loader.load()
# 2. Quebrar em chunks
splitter = RecursiveCharacterTextSplitter(chunk_size=800, chunk_overlap=120)
chunks = splitter.split_documents(docs)
# 3. Indexar
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
vs = FAISS.from_documents(chunks, embeddings)
retriever = vs.as_retriever(search_kwargs={"k": 4})
# 4. Recuperar contexto
query = "Cliente com 110 dias de atraso quer desconto e parcelamento"
context_docs = retriever.get_relevant_documents(query)
context = "\n\n".join([d.page_content for d in context_docs])
# 5. Gerar resposta
prompt = ChatPromptTemplate.from_template("""
Você é um assistente de renegociação de crédito.
Use apenas o contexto abaixo e siga as regras da política.
Contexto:
{context}
Pedido do cliente:
{query}
Responda com:
1. elegibilidade
2. proposta sugerida
3. justificativa curta
4. alerta de risco, se houver
""")
llm = ChatOpenAI(model="gpt-4.1-mini", temperature=0)
response = llm.invoke(prompt.format_messages(context=context, query=query))
print(response.content)
Esse fluxo já cobre o básico. Em uma operação real, você adiciona metadados por produto, faixa de atraso, UF, canal e versão da política. Isso melhora o filtro e evita recuperar regra errada para o caso errado.
Boas práticas de chunking
Use chunks entre 500 e 1.000 caracteres, com overlap de 10% a 20%. Em documentos jurídicos ou políticas de crédito, chunks grandes demais misturam regras distintas. Chunks pequenos demais perdem contexto. O equilíbrio costuma ser o ponto mais sensível do projeto.
Dados, governança e compliance na renegociação automatizada
Em crédito, um sistema de RAG precisa ser auditável. Cada resposta deve registrar quais documentos foram usados, qual versão da política foi consultada e qual regra liberou a oferta. Sem isso, a automação vira caixa-preta.
Uma boa prática é manter logs de recuperação e logs de geração separados. Assim, a operação consegue responder perguntas simples: por que o sistema ofereceu 12 parcelas? Qual cláusula sustentou o desconto? Quem aprovou a política vigente?
LGPD e minimização de dados
Evite enviar dados desnecessários ao LLM. Nome, CPF e número do contrato podem ser mascarados na etapa de geração. Para o contexto, use apenas o suficiente para a decisão. A ANPD reforça a importância de finalidade, necessidade e segurança no tratamento de dados pessoais.
Em crédito, a resposta certa precisa vir do documento certo, na hora certa.
Outro ponto é o human-in-the-loop. Em ofertas com desconto alto, renegociação sensível ou clientes vulneráveis, a decisão final deve passar por revisão humana. Em operações maduras, isso reduz risco e preserva a experiência do cliente.
Métricas para sair do piloto com segurança
Sem métricas, o projeto fica bonito e frágil. Em crédito e renegociação automatizada com RAG, acompanhe ao menos 5 indicadores: precision@k da busca, taxa de resposta aderente à política, tempo médio de atendimento, taxa de acordo e taxa de escalonamento humano.
Um exemplo prático: se o retriever acerta os trechos corretos em 8 de 10 consultas, mas a proposta final só fecha em 4 de 10 casos, o gargalo pode estar no prompt, nas regras ou na oferta comercial. Métrica boa aponta o próximo ajuste.
Teste A/B e amostragem
Compare atendimento assistido por RAG contra script tradicional em uma amostra de 200 a 500 interações. Avalie tempo, satisfação e adesão à política. Em muitos times, o ganho aparece primeiro em padronização, não em conversão imediata.
Para reduzir custo, rode o LLM apenas após a etapa de elegibilidade. Isso diminui chamadas desnecessárias e melhora previsibilidade. Em operações de grande volume, essa economia pesa no orçamento mensal.
Próximos passos para sair do protótipo
Depois do MVP, avance para três frentes: observabilidade, versionamento de políticas e fallback seguro. Observabilidade mostra onde o sistema erra. Versionamento garante que a proposta siga a política correta. Fallback mantém a operação funcionando quando a busca falha.
Se quiser escalar, considere uma camada de classificação antes do RAG. Um classificador simples pode separar casos de baixa complexidade, alta complexidade e exceção jurídica. Em muitas operações, isso reduz carga do time especialista em 20% ou mais, dependendo do mix de carteira.
Para referência técnica, vale revisar a documentação da Pinecone sobre RAG e a documentação do LangChain para pipelines modulares.
A IAIRON Academy ensina IA aplicada de forma prática. Conheça aqui.