Home / Nosso Blog
Leve seu marketing digital para o próximo nível com estratégias baseadas em dados e soluções inovadoras. Vamos criar algo incrível juntos!
Acompanhe semanalmente nosso canal no youtube com vídeos de marketing e performance e se inscreva-se

O Google atualizou o Search Live com Gemini 2.5 Flash Native Audio, atualizando o funcionamento da voz dentro do Search e, ao mesmo tempo, estendendo o uso do modelo para tradução e agentes de voz ao vivo. A atualização introduz respostas faladas mais naturais no Search Live e reflete o esforço do Google para melhorar as consultas de voz naturais, tratando a voz como uma interface central, como uma forma de os usuários obterem tudo o que podem obter na pesquisa regular, além de permitir que façam perguntas sobre o mundo físico ao seu redor e recebam traduções de voz imediatas entre duas pessoas que falam idiomas diferentes.
Os novos recursos de voz atualizados, lançados esta semana nos Estados Unidos, permitirão que as respostas de voz do Google soem mais naturais e podem até ser desaceleradas para conteúdo instrutivo.
De acordo com o Google:
“Quando você entra ao vivo com a Pesquisa, você pode ter uma conversa de voz no modo AI para obter ajuda em tempo real e encontrar rapidamente sites relevantes na web. E agora, graças ao nosso mais recente modelo Gemini para áudio nativo, as respostas no Search Live serão mais fluidas e expressivas do que nunca.”
Esta atualização da Pesquisa faz parte de uma atualização mais ampla do Gemini 2.5 Flash Native Audio lançada em todo o ecossistema do Google, incluindo Gemini Live (no aplicativo Gemini), Google AI Studio e Vertex AI. O modelo processa o áudio falado em tempo real e produz respostas faladas fluidas, reduzindo as barreiras à conversa natural e reduzindo o atrito nas interações ao vivo. Embora o anúncio do Google não tenha dito que o modelo era um modelo de fala para fala (em oposição à fala para texto e depois texto para fala), esta atualização segue o anúncio de outubro do Google de “Speech-to-Retrieval (S2R). É um modelo de aprendizado de máquina baseado em rede neural treinado em grandes conjuntos de dados de consultas de áudio emparelhadas. “
Essas mudanças mostram que o Google trata o áudio nativo como um recurso central em produtos voltados para o consumidor, tornando mais fácil para os usuários solicitar e receber informações sobre o mundo físico ao seu redor de uma maneira natural que não era possível anteriormente.
Para desenvolvedores e empresas que criam sistemas baseados em voz, o Google afirma que o modelo atualizado melhora a confiabilidade em diversas áreas. Gemini 2.5 Flash Native Audio aciona funções externas de forma mais consistente durante conversas, segue instruções complexas e mantém o contexto em vários turnos. Essas melhorias tornam os agentes de voz ao vivo mais confiáveis em fluxos de trabalho do mundo real, onde instruções mal interpretadas ou fluxo de conversa interrompido reduzem a usabilidade.
Além dos agentes de pesquisa e de voz, a atualização introduz suporte nativo para “tradução de fala para fala ao vivo”. Gemini traduz a linguagem falada em tempo real, seja traduzindo continuamente a fala ambiente para um idioma alvo ou gerenciando conversas entre falantes de idiomas diferentes em ambas as direções. O sistema preserva as características vocais, como ritmo e ênfase da fala, suportando uma tradução que soa mais suave e coloquial.
O Google destaca vários recursos que suportam esse recurso de tradução, incluindo ampla cobertura de idiomas, detecção automática de idioma, tratamento de entrada multilíngue e filtragem de ruído para ambientes cotidianos. Esses recursos reduzem o atrito na configuração e permitem que a tradução ocorra passivamente durante a conversa, em vez de por meio de controles manuais. O resultado é uma experiência de tradução que se comporta de forma muito semelhante a uma pessoa real no meio da tradução entre duas pessoas.
A atualização reflete a iteração contínua da pesquisa por voz do Google em direção a um ideal que foi originalmente inspirado nas interações de voz de ficção científica entre humanos e computadores na popular série de televisão e filmes Star Trek.
Google anuncia uma nova era para pesquisa por voz
Agora você pode ter conversas mais fluidas e expressivas ao entrar ao vivo com a Pesquisa.
Modelos de áudio Gemini aprimorados para interações de voz poderosas
5 maneiras de obter ajuda em tempo real ativando a Pesquisa
Imagem em destaque da Shutterstock/Jackbin
”Negócio desatualizado ele não está apenas perdendo dinheiro, mas está perdendo a chance de fazer a diferença ao mundo”
Produtor
Nossa solução traz para você um plano 100% personalizado de acordo com o seu projeto e com isso fazemos essa apresentação online em uma reunião de 20 a 40 minutos quer receber esse diagnóstico para sua empresa entre em contato via whatsapp !