DESEMPENHO DE MODELOS DE INTELIGÊNCIA ARTIFICIAL GENERATIVA EM QUESTÕES DE CONCURSO PÚBLICO DE ODONTOLOGIA: UM ESTUDO COMPARATIVO DA TAXA DE ACERTO EM SAÚDE BUCAL COLETIVA

Autores

DOI:

https://doi.org/10.70187/recisatec.v6i1.414

Palavras-chave:

Inteligência Artificial Generativa, Saúde Bucal, Saúde Pública

Resumo

O avanço da inteligência artificial generativa tem despertado interesse em sua aplicação na área da saúde, incluindo a odontologia. No entanto, ainda são escassos os estudos que avaliam o desempenho dessas ferramentas em contextos específicos da odontologia coletiva, como a resolução de questões de concurso público. Diante disso, o presente estudo teve como objetivo avaliar e comparar as taxas de acerto de três modelos de inteligência artificial generativa: ChatGPT, Gemini e DeepSeek, em suas versões gratuitas, na resolução de 100 questões de concurso público na área de saúde bucal coletiva. As questões foram extraídas de bancos públicos de provas para cirurgiões-dentistas realizadas entre 2016 e 2026, abrangendo temas como epidemiologia oral, políticas públicas do SUS, vigilância em saúde, determinantes sociais e gestão de serviços. Cada questão foi aplicada individualmente aos três modelos utilizando prompt padronizado, sem histórico de conversas prévias, e a taxa de acerto foi calculada considerando cada questão correta como equivalente a 1 ponto percentual. Os resultados demonstraram que o ChatGPT obteve o melhor desempenho (75 acertos) seguido pelo Gemini (47 acertos) e pelo DeepSeek (23 acertos). As diferenças entre todos os pares foram estatisticamente significativas (p < 0,001), com o ChatGPT superando o Gemini em 28 pontos percentuais e o DeepSeek em 52 pontos percentuais. Conclui-se que, entre os modelos gratuitos testados, apenas o ChatGPT alcançaria a pontuação mínima para aprovação na maioria dos concursos públicos para cirurgiões-dentistas em saúde bucal coletiva, enquanto Gemini e DeepSeek, nas versões avaliadas, não se mostraram ferramentas confiáveis para esse fim.

Downloads

Os dados de download ainda não estão disponíveis.

Biografia do Autor

  • Tânia Adas Saliba, Universidade Estadual Paulista "Júlio de Mesquita Filho". (UNESP). Araçatuba, São Paulo, Brasil.

    Doutora em Odontologia Legal e Deontologia. Universidade  Estadual  Paulista  "Júlio  de  Mesquita  Filho". (UNESP). Araçatuba, São Paulo, Brasil. 

  • Eder Akydawan de Paiva Gomes Fernandes, Universidade Estadual Paulista "Júlio de Mesquita Filho". (UNESP). Araçatuba, São Paulo, Brasil.

    Doutorando em Saúde Coletiva em Odontologia. Universidade Estadual Paulista "Júlio de Mesquita Filho" - UNESP. Araçatuba, São Paulo, Brasil. 

  • Cristhiane Martins Schmidt, Universidade Estadual Paulista "Júlio de Mesquita Filho". (UNESP). Araçatuba, São Paulo, Brasil.

    Doutora em Biologia Buco-Dental. Universidade  Estadual  Paulista  "Júlio  de  Mesquita  Filho". (UNESP). Araçatuba, São Paulo, Brasil. 

Referências

ALANSARI, Aisha; LUQMAN, Hamzah. Large language models hallucination: A comprehensive survey. Computer Science Review, v. 61, p. 100970, 1 ago. 2026.

ARAÚJO, Samara Lavínnya Serrano de Souza et al. Impactos do ChatGPT no ensino da Odontologia: Uma revisão de escopo. Arquivos em Odontologia, v. 61, p. 213–228, 20 dez. 2025.

BAMASHMOUS, Mohamed. The Role of Artificial Intelligence in Transforming Dental Public Health: Current Applications, Ethical Considerations, and Future Directions. 2025.

BHUYAN, Soumitra S. et al. Generative Artificial Intelligence Use in Healthcare: Opportunities for Clinical Excellence and Administrative Efficiency. Journal of Medical Systems, v. 49, n. 1, p. 10, 2025.

BICALHO, Gabriela Magalhães; OLIVEIRA, Arthur Henrique de; GUIDA, José Paulo de Siqueira. Desempenho da inteligência artificial em questões de processo seletivo de residência médica. Femina, v. 52, n. 6, p. 370–373, 14 maio 2025.

FIGUEIREDO, Maria Clara Pimenta de et al. Performance of the Artificial Intelligence large language models ChatGPT 3.5, Gemini (Google Bard), ChatGPT 4.0, and Gemini 2.5 flash in surgical subspecialty questions of Brazilian medical residency exams. Performance of the Artificial Intelligence large language models ChatGPT 3.5, Gemini (Google Bard), ChatGPT 4.0, and Gemini 2.5 flash in surgical subspecialty questions of Brazilian medical residency exams, v. 24, 2026.

MARTINS, Diogo Gonçalves dos Santos et al. Análise comparativa de desempenho entre ChatGPT, Scholar GPT e DeepSeek em provas teóricas do Conselho Brasileiro de Oftalmologia 2022. Rev. bras.oftalmol., v. 85, 11 fev. 2026.

NARVAI, Paulo Capel. Saúde bucal coletiva: caminhos da odontologia sanitária à bucalidade. Revista de Saúde Pública, v. 40, p. 141–147, 2006.

PARK, Ye-Jean et al. Assessing the research landscape and clinical utility of large language models: a scoping review. BMC Medical Informatics and Decision Making, v. 24, n. 1, p. 72, 12 mar. 2024.

SAVEGNAGO, Gleica Dal’ Ongaro et al. Inteligência artificial na odontologia: uma revisão narrativa de literatura. RFO UPF, 2024.

WANG, Shanshan et al. Generative Artificial Intelligence in Medical Imaging: Foundations, Progress, and Clinical Translation. Research, v. 8, p. 1029, 2025.

YALAMANCHILI, Amulya et al. Quality of Large Language Model Responses to Radiation Oncology Patient Care Questions. JAMA Network Open, v. 7, n. 4, p. e244630, 2 abr. 2024.

Downloads

Publicado

06/05/2026

Como Citar

Tânia Adas Saliba, Eder Akydawan de Paiva Gomes Fernandes, & Cristhiane Martins Schmidt. (2026). DESEMPENHO DE MODELOS DE INTELIGÊNCIA ARTIFICIAL GENERATIVA EM QUESTÕES DE CONCURSO PÚBLICO DE ODONTOLOGIA: UM ESTUDO COMPARATIVO DA TAXA DE ACERTO EM SAÚDE BUCAL COLETIVA. RECISATEC - REVISTA CIENTÍFICA SAÚDE E TECNOLOGIA - ISSN 2763-8405, 6(1), e61414. https://doi.org/10.70187/recisatec.v6i1.414

Artigos Semelhantes

1-10 de 196

Você também pode iniciar uma pesquisa avançada por similaridade para este artigo.