Notícias / Inteligência Artificial

Estudo usa Dungeons & Dragons para medir interação entre IA e humanos

Cientistas usam o jogo de RPG Dungeons & Dragons para testar como a IA consegue seguir regras complexas, planejar em equipe e colaborar com humanos

Participantes jogam Dungeons & Dragons durante a TwitchCon 2023 / Créditos: Getty Images

Pesquisadores tem apostado em uma técnica diferente para avaliar se modelos de Inteligência Artificial e humanos podem trabalhar bem em conjunto. O método conta com a ajuda do famoso jogo de RPG de mesa Dungeons & Dragons (D&D).

Os testes consistem basicamente em avaliar a capacidade dos modelos de criar estratégias de longo prazo. Assim como a interação deles com outros sistemas de IA e jogadores humanos.

O cenário ideal

Um estudo sobre foi apresentado no final do ano passado, na conferência NeurIPS 2025. Na ocasião, os pesquisadores afirmaram que o D&D é o cenário ideal para servir como campo de testes. A criatividade e regras rígidas exigidas são o destaque.

Acontece que para se ter um desempenho bom e consequentemente ganhar o jogo, os modelos precisam demonstrar a capacidade de planejar, comunicar e memorizar. Além disso, eles precisam demonstrar que tem conhecimentos das táticas e intenções de seus oponentes.

Mestres e heróis

De acordo com informações da revista Live Science, no experimento batizado de “Agentes de D&D”, a inteligência artificial pode assumir diferentes funções. Um único modelo consegue atuar como o Mestre, responsável por conduzir a narrativa e os monstros, ou como um dos quatro heróis da equipe.

A estrutura permite uma integração flexível, onde sistemas de IA e jogadores humanos dividem a mesa e interagem entre si para completar os desafios propostos.

Dungeons & Dragons é um campo de testes natural para avaliar o planejamento em várias etapas, a adesão às regras e a estratégia de equipe”, disse em comunicado o autor sênior do estudo, Raj Ammanabrolu , professor assistente do Departamento de Ciência da Computação e Engenharia da Universidade da Califórnia, em San Diego . “Como o jogo se desenrola por meio do diálogo, D&D também abre um caminho direto para a interação humano-IA: os agentes podem auxiliar ou jogar em conjunto com outras pessoas.”

Resultados práticos

Para viabilizar a análise, a simulação não usou uma campanha inteira de Dungeons & Dragons, focando apenas em combates da aventura “A Mina Perdida de Phandelver”. O objetivo era testar a gestão de recursos, como magias, sob pressão. Três modelos foram avaliados: DeepSeek-V3, Claude Haiku 3.5 e GPT-4.

O Claude Haiku 3.5 liderou tanto na eficiência tática quanto na atuação, adaptando bem sua linguagem ao personagem. O GPT-4 ficou em segundo, enquanto o DeepSeek se mostrou mais repetitivo. Curiosamente, até monstros controlados pela IA demonstraram criatividade espontânea, gritando frases provocativas durante as batalhas.

Esses resultados indicam que a tecnologia está evoluindo para lidar com desafios reais, como logística e resgate de desastres, que exigem planejamento complexo. O próximo passo da pesquisa será implementar campanhas completas, aumentando a exigência de improvisação e a colaboração entre humanos e máquinas.