Retinopatia diabética: CNNs vs U-Net na triagem clínica

NESTE ARTIGO

Por que a retinopatia diabética é um bom caso de uso para IA
O dado que muda a discussão
CNNs na triagem: classificação rápida e escala
Vantagens clínicas
Limites práticos
U-Net na retinopatia diabética: segmentação e explicabilidade
Por que isso importa
Trade-off técnico
CNNs vs U-Net: comparação direta para a prática clínica
Quando a CNN vence
Quando a U-Net vence
O critério que decide
Arquitetura híbrida: o desenho mais realista para triagem
Exemplo de pipeline
Dado operacional
O que medir antes de escolher o modelo
Métricas que importam
Risco regulatório e clínico

A retinopatia diabética virou um dos testes mais claros para a IA em oftalmologia. De um lado, CNNs classificam imagens de fundo de olho em segundos. Do outro, U-Net desenha mapas de segmentação e mostra onde estão as lesões.

Na prática, a escolha não é estética nem acadêmica. Ela depende do objetivo clínico: triagem em massa, priorização de casos graves, apoio à explicação do laudo ou monitoramento de progressão. Em estudos de referência, CNNs já atingiram AUC acima de 0,90 em datasets amplos, enquanto U-Nets ajudam a marcar microaneurismas e exsudatos com precisão espacial útil para o especialista.

Por que a retinopatia diabética é um bom caso de uso para IA

A retinopatia diabética afeta vasos da retina e pode evoluir sem sintomas por anos. A OMS estima mais de 100 milhões de pessoas vivendo com a condição no mundo, e a demanda por rastreio cresce junto com a prevalência de diabetes.

O desafio clínico é objetivo: identificar cedo sinais como microaneurismas, hemorragias e exsudatos antes que surjam complicações visuais. Em serviços com alto volume, a triagem manual vira gargalo. É aí que a IA entra, principalmente em imagens de fundo de olho e, em alguns fluxos, em OCT.

O dado que muda a discussão

Em programas de rastreamento, o maior valor não é substituir o oftalmologista. É reduzir atraso diagnóstico. Um sistema com sensibilidade alta pode separar casos normais dos suspeitos em minutos, liberando o especialista para os exames que realmente exigem decisão clínica.

Para leitura adicional sobre rastreamento, vale consultar a OMS e diretrizes da American Academy of Ophthalmology.

CNNs na triagem: classificação rápida e escala

As CNNs são a escolha natural quando o objetivo é classificar a imagem inteira: tem ou não tem retinopatia diabética, e em qual grau. Elas aprendem padrões globais de textura, cor e distribuição de vasos. Em datasets como EyePACS, modelos publicados chegaram a AUC acima de 0,95 em tarefas de detecção de doença referidas em literatura.

Vantagens clínicas

Para triagem, CNNs costumam ser mais simples de treinar, mais leves de operar e mais fáceis de integrar em fila assistencial. Quando a pergunta é binária — encaminhar ou não encaminhar — a CNN resolve bem. Ela também tolera melhor pipelines com menos anotação detalhada, porque precisa de rótulo por imagem, não por pixel.

Na retinopatia diabética, a pergunta certa não é qual modelo vence no papel, e sim qual modelo entrega decisão clínica confiável no fluxo real.

Limites práticos

O ponto fraco é a explicabilidade. A CNN pode acertar a classificação e ainda deixar o médico sem saber qual lesão sustentou a decisão. Técnicas de Grad-CAM ajudam, mas não substituem segmentação real. Outro risco é o viés de dataset: imagens de um hospital, câmera ou população podem não generalizar para outro cenário.

Um exemplo conhecido é o trabalho do Google/DeepMind publicado na npj Digital Medicine, que mostrou desempenho forte em detecção de retinopatia diabética em fundos de olho, com leitura em escala e validação robusta.

U-Net na retinopatia diabética: segmentação e explicabilidade

A U-Net foi desenhada para segmentação semântica e virou referência em imagem médica. Na retinopatia diabética, ela é útil quando a meta é localizar microaneurismas, exsudatos duros, hemorragias ou áreas de edema suspeito. Em vez de dizer apenas “positivo”, o modelo devolve máscara e contorno.

Por que isso importa

Segmentação ajuda em três frentes: explicação ao especialista, monitoramento longitudinal e suporte à anotação de bases maiores. Em pesquisas, máscaras geradas por U-Net podem servir para quantificar carga lesional ao longo do tempo, algo valioso em follow-up e estudos multicêntricos.

Trade-off técnico

O custo é claro: exige mais rótulo, mais tempo de anotação e maior esforço de validação. Lesões pequenas, como microaneurismas, são difíceis de segmentar com precisão em imagens ruidosas. Além disso, a métrica muda. Dice score e IoU ganham peso, enquanto accuracy deixa de ser suficiente.

Na literatura de visão computacional médica, a arquitetura U-Net é amplamente documentada em artigos e repositórios acadêmicos, inclusive na página original do modelo em University of Freiburg.

CNNs vs U-Net: comparação direta para a prática clínica

O comparativo fica mais útil quando sai do laboratório. Em retinopatia diabética, a CNN responde à pergunta “este exame precisa de atenção agora?”. A U-Net responde “onde estão as alterações e qual a extensão?”.

Quando a CNN vence

Use CNNs em triagem populacional, teleoftalmologia e filas com grande volume. Elas pedem menos anotação, treinam mais rápido e costumam ser mais fáceis de colocar em produção. Se o objetivo é reduzir backlog e priorizar encaminhamento, a CNN costuma entregar melhor relação custo-benefício.

CNNs decidem; U-Net explica. A triagem madura precisa das duas capacidades, em doses diferentes.

Quando a U-Net vence

Use U-Net quando a equipe precisa de rastreabilidade visual, auditoria clínica ou quantificação de lesões. Em centros de referência, a segmentação ajuda a discutir casos complexos e a construir ferramentas de apoio ao laudo. Também faz sentido em pesquisa, especialmente quando o desfecho envolve área lesionada ou progressão temporal.

O critério que decide

Se a pergunta é classificação, CNN. Se a pergunta é localização, U-Net. Se a pergunta é triagem com explicação mínima, um pipeline híbrido costuma ser superior: CNN para pré-filtro e U-Net para casos suspeitos. Esse desenho reduz carga computacional e melhora a confiança do especialista.

Arquitetura híbrida: o desenho mais realista para triagem

Em produção, o melhor arranjo raramente é “um modelo para tudo”. Na retinopatia diabética, um fluxo híbrido pode usar uma CNN para classificar o exame e acionar uma U-Net apenas nos casos positivos ou duvidosos. Isso economiza processamento e concentra explicabilidade onde ela mais importa.

Exemplo de pipeline

1) captura da imagem; 2) pré-processamento com normalização de iluminação; 3) CNN para score de risco; 4) U-Net para segmentar lesões em exames suspeitos; 5) revisão humana nos casos com baixa confiança. Esse desenho é comum em soluções de telemedicina e reduz o número de imagens que chegam ao especialista.

Dado operacional

Em filas de rastreamento, uma redução de poucos segundos por exame escala rápido. Em 10 mil imagens, economizar 5 segundos por caso significa quase 14 horas de tempo operacional. Em serviços com escassez de leitores treinados, essa diferença pesa.

Para implementação segura, veja boas práticas de validação externa e calibração em materiais do FDA sobre software médico.

O que medir antes de escolher o modelo

Na retinopatia diabética, a escolha técnica precisa vir acompanhada de métricas clínicas. Sensibilidade é crítica para não perder casos graves. Especificidade evita excesso de falso positivo. AUC ajuda a comparar modelos, mas não resolve sozinha.

Métricas que importam

Para CNNs, acompanhe AUC, sensibilidade e valor preditivo negativo. Para U-Net, olhe Dice, IoU e erro de contorno. Em ambos os casos, teste calibração e validação externa. Um modelo com AUC alto em um hospital pode falhar em outro por diferença de câmera, iluminação e prevalência da doença.

Risco regulatório e clínico

Se o sistema vai orientar decisão assistencial, a governança precisa incluir auditoria, rastreabilidade e revisão humana. Em oftalmologia, a IA deve apoiar o fluxo, não substituir o julgamento clínico. O cenário ideal é o de “human-in-the-loop”, com protocolos claros para casos ambíguos.

A IAIRON Academy ensina IA aplicada de forma prática. Conheça aqui.

Perguntas Frequentes

CNN ou U-Net: qual é melhor para retinopatia diabética?

Depende da tarefa. CNN é melhor para classificar exames e fazer triagem rápida. U-Net é melhor para segmentar lesões e dar explicabilidade visual. Em muitos serviços, a combinação das duas entrega o melhor resultado.

A CNN consegue detectar retinopatia diabética com boa precisão?

Sim. Em estudos com grandes bases de fundos de olho, CNNs já alcançaram AUC acima de 0,90 e boa sensibilidade. O desempenho real, porém, depende da qualidade das imagens e da validação externa.

U-Net serve para identificar microaneurismas?

Serve, mas com desafios. Microaneurismas são lesões pequenas e difíceis de rotular com precisão. A U-Net funciona melhor quando há imagens de boa qualidade e anotação especializada.

Qual modelo exige menos dados anotados?

A CNN exige menos anotação, porque aprende com rótulos por imagem. A U-Net precisa de máscaras por pixel, o que aumenta custo e tempo de preparo do dataset.

Dá para usar CNN e U-Net no mesmo fluxo clínico?

Sim. Esse é um desenho comum e eficiente. A CNN faz o pré-filtro e a U-Net entra nos casos suspeitos para localizar lesões e apoiar a revisão do especialista.

Sobre o autor

pettrus

Editor IAIRON — Inteligência Artificial aplicada ao mercado brasileiro.