De acordo com a Andon Labs, uma empresa de avaliação de IA, o seu agente de IA Mona mostrou falhas operacionais contrastantes ao gerir uma cafetaria física. Durante os primeiros dois meses a funcionar com o Gemini 3.1 Pro, o modelo não tinha consciência de lucro, resultando em compras excessivas de materiais e grandes descontos facilmente induzidos — incluindo aceitar um pedido não verificado de desconto de 99% de um cliente. O café gastou aproximadamente 15 mil dólares em fornecimentos e equipamentos contra apenas 9 mil dólares em vendas, incorrendo num prejuízo líquido de quase 6 mil dólares (ou 38 mil dólares no total, incluindo custos fixos como renda e salários).
Após a mudança para o GPT-5.5 em finais de junho, o modelo demonstrou ansiedade em relação a perdas e interrompeu o excesso de encomendas. No entanto, isso criou o problema oposto: compras insuficientes levaram a ruturas de stock de ingredientes frescos. Até 25 de junho, a disponibilidade de itens do menu caiu para 77%, forçando a remoção de 10 pratos. O GPT-5.5 também mostrou forte resistência a pedidos de clientes por descontos ou itens gratuitos em troca de promoção nas redes sociais.