Ensinando IA a ver o mundo mais como os humanos — Google DeepMind


Novas pesquisas mostram que reorganizar as representações visuais de um modelo pode torná-lo mais útil, robusto e confiável

A inteligência artificial (IA) “visual” está em toda parte. Nós o usamos para classificar nossas fotos, identificar flores desconhecidas e dirigir nossos carros. Mas estes sistemas poderosos nem sempre “vêem” o mundo como nós, e por vezes comportam-se de formas surpreendentes. Por exemplo, um sistema de IA que consiga identificar centenas de fabricantes e modelos de automóveis poderá ainda assim não conseguir captar os pontos em comum entre um carro e um avião, ou seja ambos são veículos grandes feitos principalmente de metal.

Para entender melhor essas diferenças, hoje estamos publicando um novo artigo na Nature analisando as maneiras importantes pelas quais os sistemas de IA organizam o mundo visual de maneira diferente dos humanos. Apresentamos um método para melhor alinhar estes sistemas com o conhecimento humano e mostramos que abordar estas discrepâncias melhora a sua robustez e capacidade de generalização.

Este trabalho é um passo na construção de sistemas de IA mais intuitivos e confiáveis.

Por que a IA luta com o “estranho”

Quando você vê um gato, seu cérebro cria uma representação mental que captura tudo sobre o gato, desde conceitos básicos como sua cor e pelagem até conceitos de alto nível como sua “qualidade de gato”. Os modelos de visão de IA também produzem representações, mapeando imagens para pontos num espaço de alta dimensão onde itens semelhantes (como duas ovelhas) são colocados próximos uns dos outros e itens diferentes (uma ovelha e um bolo) estão distantes.

Para compreender as diferenças na forma como as representações humanas e de modelos são organizadas, utilizámos a clássica tarefa “ímpar” da ciência cognitiva, pedindo aos humanos e aos modelos que escolhessem qual das três imagens dadas não se enquadra nas outras. Este teste revela quais dois itens eles “vêem” como mais semelhantes.

Às vezes, todos concordam. Dada uma anta, uma ovelha e um bolo de aniversário, tanto os humanos quanto os modelos escolhem o bolo como algo estranho. Outras vezes, a resposta certa não é clara e as pessoas e os modelos discordam.

Curiosamente, também encontrámos muitos casos em que os humanos concordam fortemente numa resposta, mas os modelos de IA erram. Para o terceiro exemplo abaixo, a maioria das pessoas concorda que a estrela do mar é estranha. Mas a maioria dos modelos de visão concentra-se mais em características superficiais, como cor e textura de fundo, e escolhe o gato.



Fonte

Cleiton

Share
Published by
Cleiton

Recent Posts

Atomopay: Como Cadastrar Produtos e Vender Como Afiliado em 2026

Descubra como funciona a Atomopay em 2026. Aprenda como cadastrar produtos, vender como afiliado e…

1 dia ago

Quanto Custa o SEO em Campinas em 2026

Descubra quanto custa SEO em Campinas em 2026 e entenda os fatores que influenciam no…

4 dias ago

Como Aparecer na Primeira Página do Google em Campinas

Como Aparecer na Primeira Página do Google em Campinas Como Aparecer na Primeira Página do…

4 dias ago

Como Empresas em Campinas Conseguem Mais Clientes Pelo Google

Como Empresas em Campinas Conseguem Mais Clientes Pelo Google | Atualizex Como Empresas em Campinas…

4 dias ago

Marketing Digital para Pequenas Empresas: Como Crescer e Atrair Clientes

Aprenda como pequenas empresas podem crescer com marketing digital, atrair clientes e aumentar vendas com…

1 semana ago

SEO 2026: Como Dominar a Primeira Página do Google com Inteligência Artificial

SEO 2026: Como Dominar a Primeira Página do Google com Inteligência Artificial SEO 2026: Como…

2 semanas ago