Modelos de grande linguagem de uso geral superam as ferramentas clínicas especializadas de IA em benchmarks médicos
Modelos de grande linguagem de uso geral superam as ferramentas clínicas especializadas de IA em benchmarks médicos
Ferramentas especializadas de inteligência artificial clínica (IA) estão entrando na prática médica, apesar da escassa avaliação independente. Avaliamos quantitativamente duas ferramentas clínicas de IA, OpenEvidence e UpToDate Expert AI, baseadas em grandes modelos de linguagem (LLMs) em relação a três LLMs de fronteira: GPT-5.


