Timnit Gebru recusa retirar o artigo de IA e é despedida pela Google; cinco anos depois, as 5 principais previsões acertam na íntegra

GOOGLX-0,44%

谷歌開除Timnit Gebru

Em dezembro de 2020, Timnit Gebru (na altura co-responsável pelas equipas de ética da IA na Google) recebeu, durante as férias, um e-mail a informá-la de que tinha sido despedida pela Google. A causa foi um pedido da Google para remover ou retirar do trabalho académico a afiliação dos funcionários; ela recusou. O artigo descrevia ilusões e falta de compreensão, amplificação de preconceitos, custos ambientais, impossibilidade de auditoria dos dados de treino e centralização linguística — cinco anos depois, a realidade encontrou exemplos em cada um desses pontos.

Confronto de cinco “profecias” com a realidade: casos e dados confirmados

Ilusões e falta de compreensão: O artigo, em 2021, descreveu o fenómeno que mais tarde ficou conhecido como “alucinações”. Referia que os LLM apenas juntam formas de linguagem por probabilidades, “sem qualquer referência ao significado”. Este problema tornou-se uma falha conhecida de todos os principais sistemas de IA e foi corroborado em várias avaliações académicas independentes.

Amplificação de preconceitos: A ferramenta de recrutamento por IA da Amazon, desenvolvida desde 2014, foi abandonada em 2018 devido a discriminação sistemática contra candidatas mulheres; o modelo aprendeu critérios de avaliação inclinados para homens a partir de históricos profissionais maioritariamente masculinos. Um estudo de Obermeyer et al., publicado em 2019 na revista《Science》, revelou que um algoritmo amplamente utilizado para prever risco médico substituía “gravidade da condição” por “despesa com cuidados de saúde”, levando a que, para a mesma pontuação de risco, pacientes negros apresentassem, na prática, condições mais graves. A investigação confirmou que, após a correção, a proporção de pacientes negros que seriam classificados como necessitando de cuidados adicionais passaria de 17,7% para 46,5%.

Custos ambientais: O relatório ambiental da Google de 2024 revelou que, em 2023, as emissões de gases com efeito de estufa atingiram cerca de 14,3 milhões de toneladas métricas de CO₂e, um aumento de 48% face ao valor de referência de 2019. A Google confirmou que a principal razão foi o forte aumento do consumo de eletricidade nos centros de dados impulsionado pela IA, colocando diretamente em risco a meta original da Google de neutralidade carbónica até 2030.

Impossibilidade de auditoria dos dados de treino: Em dezembro de 2023, o Observatório de Redes da Universidade de Stanford detetou 3.226 instâncias suspeitas de conteúdo de abuso sexual de menores (CSAM) no conjunto de dados LAION-5B (com 5,85 mil milhões de pares imagem-texto, que chegou a ser usado para treinar o Stable Diffusion), das quais 1.008 foram confirmadas por entidades externas. O LAION-5B foi retirado imediatamente.

Centralização linguística: Um estudo de Thompson et al., em 2024, analisou um corpus de internet composto por 6,38 mil milhões de frases e constatou que 57,1% das frases pertenciam a coleções paralelas multilingues, ou seja, muito provavelmente conteúdo repetitivo de baixa qualidade produzido por tradução automática. Além disso, esta proporção é especialmente elevada em línguas de poucos recursos, sugerindo que os corpora dessas línguas estão a ser contaminados por produtos de baixa qualidade provenientes de tradução automática.

Fatos confirmados do despedimento de Gebru e contexto do artigo

O artigo tem seis autores, sendo quatro funcionários da Google. No momento em que Gebru recebeu a notificação de despedimento, encontrava-se de férias; o pedido da Google era retirar do trabalho ou remover a afiliação com nome de funcionários. Depois de Gebru recusar, foi informada, durante as férias, da decisão de despedimento.

O artigo foi publicado formalmente em março de 2021. O artigo afirma claramente que as empresas que constroem LLM, pelas suas dinâmicas financeiras e de competição, não podem, de forma estrutural, permitir que “segurança e ética” atrasem a colocação no mercado do produto. O episódio do despedimento de Gebru, por si só, tem sido amplamente citado como validação concreta desse argumento estrutural.

Perguntas frequentes

Qual é a principal tese académica do artigo “Random Parrots”?

De acordo com o próprio artigo, existem duas camadas de argumento central. A primeira é técnica: aponta cinco riscos sistémicos dos LLM — alucinações, amplificação de preconceitos, custos ambientais, impossibilidade de auditoria dos dados e centralização linguística. A segunda, mais fundamental, afirma que é difícil resolver esses cinco tipos de risco porque as empresas que constroem LLM, sob pressão competitiva e financeira, tendem estruturalmente a priorizar a velocidade em vez da segurança. O artigo foi aprovado na revisão por pares do simpósio ACM FAccT.

Como é que o problema de enviesamento da ferramenta de recrutamento por IA da Amazon foi detetado e tratado?

De acordo com notícias públicas, a ferramenta de recrutamento por IA da Amazon começou a ser desenvolvida em 2014. O modelo foi treinado com dados históricos de candidaturas com predominância masculina nos últimos dez anos, pelo que aprendeu automaticamente padrões de avaliação inclinados para homens, levando a que currículos contendo termos como “women's chess club” fossem penalizados automaticamente. Este problema de enviesamento foi detetado em 2018. A Amazon abandonou então a ferramenta e confirmou que não a utilizou para avaliar candidatos reais.

O aumento das emissões de carbono divulgado no relatório ambiental de 2024 da Google é atribuído totalmente à IA?

De acordo com o relatório ambiental de 2024 da Google, em 2023 as emissões de gases com efeito de estufa atingiram cerca de 14,3 milhões de toneladas métricas de CO₂e, um aumento de 48% face ao valor de referência de 2019. A Google indica explicitamente que a causa principal foi o forte aumento do consumo de eletricidade nos centros de dados impulsionado pela IA. A explicação da Google não sustenta que o aumento das emissões de carbono seja causado a 100% pela IA, mas confirma que a expansão da infraestrutura de IA é o fator motriz mais importante para o aumento.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário