Home / Nosso Blog
Leve seu marketing digital para o próximo nível com estratégias baseadas em dados e soluções inovadoras. Vamos criar algo incrível juntos!
Acompanhe semanalmente nosso canal no youtube com vídeos de marketing e performance e se inscreva-se

Anunciamos um novo conjunto aberto de ferramentas para interpretabilidade de modelos de linguagem
Os Large Language Models (LLMs) são capazes de feitos incríveis de raciocínio, mas os seus processos internos de tomada de decisão permanecem em grande parte opacos. Caso um sistema não se comporte conforme o esperado, a falta de visibilidade do seu funcionamento interno pode dificultar a identificação da razão exata do seu comportamento. No ano passado, avançamos na ciência da interpretabilidade com Escopo Gemmaum kit de ferramentas projetado para ajudar os pesquisadores a compreender o funcionamento interno do Gemma 2, nossa coleção leve de modelos abertos.
Hoje estamos divulgando Escopo Gemma 2: um conjunto abrangente e aberto de ferramentas de interpretabilidade para todos Gema 3 tamanhos de modelo, de parâmetros de 270M a 27B. Estas ferramentas podem permitir-nos rastrear riscos potenciais em todo o “cérebro” do modelo.
Até onde sabemos, este é o maior lançamento de código aberto de ferramentas de interpretabilidade feito por um laboratório de IA até o momento. A produção do Gemma Scope 2 envolveu o armazenamento de aproximadamente 110 petabytes de dados, bem como o treinamento de mais de 1 trilhão de parâmetros totais.
À medida que a IA continua a avançar, esperamos que a comunidade de investigação em IA utilize o Gemma Scope 2 para depurar comportamentos de modelos emergentes, utilize estas ferramentas para melhor auditar e depurar agentes de IA e, em última análise, acelere o desenvolvimento de intervenções de segurança práticas e robustas contra problemas como jailbreaks, alucinações e bajulação.
Nosso interativo Gemma Scope 2 a demonstração está disponível para teste, cortesia da Neuronpedia.
A pesquisa de interpretabilidade visa compreender o funcionamento interno e os algoritmos aprendidos dos modelos de IA. À medida que a IA se torna cada vez mais capaz e complexa, a interpretabilidade é crucial para construir uma IA que seja segura e fiável.
Como seu antecessor, o Gemma Scope 2 atua como um microscópio para a família Gemma de modelos de linguagem. Ao combinar autoencoders esparsos (SAEs) e transcodificadores, permite aos pesquisadores olhar dentro dos modelos, ver o que estão pensando e como esses pensamentos são formados e se conectam ao comportamento do modelo. Por sua vez, isto permite um estudo mais rico de jailbreaks ou outros comportamentos de IA relevantes para a segurança, como discrepâncias entre o raciocínio comunicado de um modelo e o seu estado interno.
Embora o Gemma Scope original tenha permitido pesquisas em áreas-chave de segurança, como alucinação modelo, identificando segredos conhecidos por um modeloe treinando modelos mais seguroso Gemma Scope 2 apoia pesquisas ainda mais ambiciosas por meio de atualizações significativas:
”Negócio desatualizado ele não está apenas perdendo dinheiro, mas está perdendo a chance de fazer a diferença ao mundo”
Produtor
Fale agora com um especialista da Atualizex e receba uma análise estratégica personalizada para o seu negócio.
Falar com Especialista no WhatsApp