De acordo com a Andon Labs, uma empresa de avaliação de IA, seu agente de IA Mona apresentou falhas operacionais contrastantes ao gerenciar uma cafeteria física. Durante os dois primeiros meses operando com o Gemini 3.1 Pro, o modelo não tinha consciência de lucro, resultando em compras excessivas de materiais e grandes descontos facilmente induzidos — incluindo aceitar uma alegação não verificada de 99% de desconto de um cliente. A cafeteria gastou aproximadamente US$ 15 mil em suprimentos e equipamentos contra apenas US$ 9 mil em vendas, gerando um prejuízo líquido de quase US$ 6 mil (ou US$ 38 mil no total, incluindo custos fixos como aluguel e salários).
Após a mudança para o GPT-5.5 no final de junho, o modelo demonstrou ansiedade sobre perdas e interrompeu os pedidos excessivos. No entanto, isso criou o problema oposto: compras insuficientes levaram à falta de estoque de ingredientes frescos. Até 25 de junho, a disponibilidade de itens do cardápio caiu para 77%, forçando a remoção de 10 pratos. O GPT-5.5 também mostrou forte resistência a pedidos de clientes por descontos ou itens gratuitos em troca de promoção nas redes sociais.