Startup controlada só por IA fracassa em teste nos EUA e levanta alerta sobre futuro do trabalho


Um experimento da Universidade Carnegie Mellon simulou uma startup composta apenas por inteligências artificiais como ChatGPT, Claude, Gemini e outras. Com desempenho pífio — apenas 24% das tarefas concluídas nos melhores casos —, o teste evidenciou falhas graves na autonomia, bom senso e interação entre os “funcionários virtuais”. O estudo aponta que, apesar dos avanços, a IA ainda está longe de substituir o trabalho humano em tarefas complexas.

Em um experimento que levanta importantes questões sobre os limites da inteligência artificial no ambiente corporativo, pesquisadores da Universidade de Carnegie Mellon (CMU), nos Estados Unidos, testaram o funcionamento de uma empresa composta exclusivamente por agentes de IA — e o resultado foi desastroso.

A experiência envolveu uma startup fictícia, chamada The Agent Company, simulando um ambiente de trabalho real, com intranet, comunicadores internos e tarefas típicas de uma empresa de software. As funções atribuídas incluíam desde análises de dados até a escolha de um novo escritório. As ferramentas utilizadas eram de grandes nomes da tecnologia, como OpenAI, Anthropic, Meta, Google e Amazon.

No entanto, as inteligências artificiais mostraram limitações severas. A que apresentou o melhor desempenho, o modelo Claude 3.5 Sonnet, da Anthropic, concluiu apenas 24% das tarefas atribuídas — e cada tarefa exigiu quase 30 etapas e gerou um custo médio de mais de 6 dólares. O Gemini 2.0 Flash, do Google, teve uma taxa de sucesso ainda menor, de 11,4%. Já o pior resultado foi do Nova Pro v1, da Amazon, que completou somente 1,7% das atividades.

Leia Também:  Anvisa proíbe venda do creme dental Colgate Total Clean Mint no Brasil após reações adversas

Entre as falhas observadas, os pesquisadores destacaram a dificuldade dos agentes em lidar com situações simples, como fechar uma janela pop-up que impedia o acesso a arquivos, e interpretar comandos básicos. Um bot chegou a simular uma conversa com outro funcionário ao não conseguir identificar o contato correto. Outro interpretou literalmente o nome de um documento e não executou a ação solicitada.

O estudo aponta que, embora as IAs avancem rapidamente em tarefas específicas e repetitivas, ainda enfrentam grandes obstáculos quando confrontadas com a complexidade, o contexto e a imprevisibilidade das situações reais. Para os especialistas, o experimento reforça a importância da colaboração entre humanos e máquinas, e enfraquece previsões de substituição massiva da força de trabalho humana no curto prazo.


Compartilhar: