Search
Close this search box.

ChatGPT é reprovado em teste de diagnóstico médico em crianças: resultados preocupantes

A plataforma de inteligência artificial ChatGPT, desenvolvida pela OpenAI, falhou novamente em testes de diagnóstico médico. Pesquisadores do Cohen Children’s Medical Center, em Nova York, constataram que o ChatGPT não apresenta as mesmas habilidades diagnósticas de um pediatra humano, ao realizar testes para determinar doenças e condições médicas em crianças.

Essa não é a primeira vez que a plataforma é criticada por respostas envolvendo saúde. Em um estudo anterior, a versão gratuita do chatbot apresentou respostas erradas e até perigosas sobre o uso de medicamentos. O uso de inteligência artificial na área médica é um dos debates em destaque na indústria, e os resultados do ChatGPT levantam questões sobre a capacidade das IAs em substituir completamente os profissionais de saúde.

Nota zero para o ChatGPT

O ChatGPT, um chatbot de inteligência artificial desenvolvido pela OpenAI, obteve uma taxa de erro de 83% em um teste que avaliou sua capacidade de diagnosticar casos médicos. Os cientistas apresentaram 100 casos de medicina para o ChatGPT com o motor GPT-4, utilizando questões e desafios reais da área publicados na última década. No total, o chatbot acertou apenas 17 casos, errando completamente 72 questões e apresentando resultados insuficientes ou incompletos para os 11 desafios restantes.

O principal problema identificado no ChatGPT é sua incapacidade de relacionar sintomas entre si ou conectá-los com características do paciente. O chatbot falha em identificar questões neurológicas e de comportamento descritas no enunciado do desafio, por exemplo, ou então relacionar uma dieta como possível causa da deficiência de uma vitamina. Essa limitação impede que o chatbot faça um caminho lógico até uma possível resposta correta.

Apesar do resultado insatisfatório, o grupo que aplicou o teste não considera o ChatGPT uma causa perdida. Segundo o artigo, se o chatbot for treinado com literatura médica especializada, em vez de textos de toda a internet, o serviço pode melhorar no auxílio da medicina diagnóstica. Além disso, o acesso a dados em tempo real e atualizados também melhoraria a precisão, algo que hoje não é possível na plataforma da OpenAI.

Em resumo, o ChatGPT obteve uma nota zero no teste de diagnóstico médico, apresentando uma taxa de erro de 83%. Embora sua limitação em relacionar sintomas e características do paciente seja um grande obstáculo, há possibilidades de melhoria por meio de treinamento com literatura médica especializada e acesso a dados em tempo real e atualizados.

Foto de Mojahid Mottakin na Unsplash

Vinicius Junior

Vinicius Junior

Entusiasta da comunicação, Vinicius é Analista de TI e colaborador na revisão dos artigos deste blog, os quais são gerados por IA.