Modelo foi integrado ao Bard, rival do ChatGPT e chegará a outros produtos do Google, como Busca e Chrome, nos próximos meses. IA foi criada para funcionar tanto em infraestruturas grandes, como as de data centers, quanto em celulares. Gemini, IA do Google, foi desenvolvida para ser flexível e funcionar de data centers a celulares com versões Ultra, Pro e Nano
Divulgação/Google
O Google lançou nesta quarta-feira (6) o Gemini, modelo de inteligência artificial (IA) que é tratado pela empresa como o mais poderoso já criado por sua equipe. Ele funciona como o “motor” do Bard (concorrente do ChatGPT), mas, por enquanto, está disponível apenas em inglês.
A exemplo do ChatGPT, o Bard é um chatbot (robô conversador): funciona como uma página de bate-papo. Baseado na inteligência artificial LaMDA (sigla em inglês para “Modelo de Linguagem para Aplicações de Diálogo”), ele é capaz de “imitar” humanos ao fornecer respostas a perguntas feitas pelos usuários.
Para gerar mensagens com as informações solicitadas, essas ferramentas usam uma infinidade de textos disponíveis na internet.
O Gemini também poderá ser usado por outros aplicativos e, na prática, vai competir com ferramentas como o GPT-4, o modelo de IA da OpenAI usado no ChatGPT.
Segundo o Google, o Gemini superou a capacidade humana em um teste de conhecimento e solução de problemas que combina 57 temas, incluindo matemática, física e história. A empresa também diz que ele se saiu melhor nesse teste do que o GPT-4.
Saiba mais sobre a nova inteligência artificial do Google:
O que o Gemini pode fazer?
Como o Gemini funciona?
Quando ele estará disponível?
O que torna o Gemini mais poderoso?
O Gemini é confiável?
O que o Gemini faz?
Segundo o Google, o Gemini será útil para realizar tarefas que exigem mais capacidade de raciocínio. Ele poderá ser usado tanto para ajudar programadores com códigos complexos quanto estudantes com a lição de casa, por exemplo.
Em uma demonstração, o Gemini conseguiu analisar a foto de um exercício de física e identificar um erro no cálculo. A IA foi capaz de apresentar a solução correta e criar problemas semelhantes para o usuário tentar resolver.
Demonstração do Google mostra que Gemini analisa exercício de física e identifica quando há um erro de cálculo
Divulgação/Google
Como o Gemini funciona?
O Gemini é o modelo de IA mais flexível já desenvolvido pelo Google. A ideia é que ele consiga rodar tanto em infraestruturas grandes, como as de data centers, quanto em dispositivos mais limitados, como celulares.
Para atender a esse objetivo, a nova inteligência artificial terá três versões:
⚡ Gemini Ultra: maior e mais poderoso, voltado para tarefas altamente complexas – será liberado apenas em 2024.
💻 Gemini Pro: voltado para rodar uma ampla gama de tarefas e atender a usuários, a partir desta quarta-feira no Bard, e a desenvolvedores, a partir de 13 de dezembro.
📱 Gemini Nano: vai rodar diretamente nos dispositivos móveis para os quais foi criado, o que lhe permite funcionar mesmo quando não há internet – disponível no Pixel 8 Pro, o celular do Google, para criar resumos de áudios e sugerir respostas inteligentes no WhatsApp.
R$ 24 mil de salário: a carreira em TI que deve bombar em 2024
Taylor Swift, Barbie e Flamengo: o que bombou no Tinder este ano
Voltar ao topo
Quando ele estará disponível?
O primeiro contato de muitos usuários com o Gemini deverá ser com a versão Pro, que vai melhorar raciocínio, planejamento e compreensão do Bard. A partir desta quarta, o robô do Google já vai usar a nova IA em respostas em inglês (outros idiomas receberão a atualização em breve).
No início de 2024, o Google vai lançar o Bard Advanced, que fará o Gemini Ultra estar disponível no Bard. E, ainda segundo a empresa, nos próximos meses o Gemini se integrará a produtos como Busca e Chrome.
A partir de 13 de dezembro, desenvolvedores e empresas poderão usar o Gemini Pro por meio das plataformas de inteligência artificial Google AI Studio e Google Cloud Vertex AI. E o Gemini Ultra vai passar por mais verificações de segurança antes de ser liberado para todos em 2024.
Bard pode ser usado na busca do Google; veja como fazer
Modelo do ChatGPT está disponível no Bing, buscador da Microsoft
Voltar ao topo
O que torna o Gemini mais poderoso?
O Google diz que a abordagem para desenvolver o Gemini foi um pouco diferente da adotada em outros modelos de inteligência artificial multimodais, isto é, que conseguem entender ao mesmo tempo diferentes formatos, como textos, imagens, áudios e códigos.
Segundo a empresa, a criação de modelos de IA costuma envolver “treinamentos” separados, com foco em cada formato. Em uma segunda etapa, o aprendizado de texto é reunido com o de imagem, por exemplo, e tudo é “empacotado” em apenas um produto.
Na avaliação do Google, esse método permite realizar algumas tarefas, como descrever imagens, mas tem limitações nos casos que exigem mais raciocínio.
“Projetamos o Gemini para ser nativamente multimodal, pré-treinado desde o início em diferentes modalidades. Em seguida, aperfeiçoamos com dados multimodais adicionais para refinar ainda mais sua eficácia”, disse Demis Hassabis, diretor-executivo da DeepMind, subsidiária de IA do Google.
Como tirar o ‘online’ do Instagram e usar o app sem ninguém saber
O supercomputador brasileiro entre os mais rápidos do mundo
Voltar ao topo
O Gemini é confiável?
O Google admite que, como toda inteligência artificial, o Gemini também está sujeito ao problema de alucinação, um erro que faz a resposta de um robô incluir informações incorretas, tendenciosas ou sem sentido.
Mas a empresa diz que o Gemini é capaz de fazer as melhores avaliações de segurança de uma IA já criada por sua equipe. O objetivo é que ela seja capaz de evitar conteúdo violento ou estereotipado, por exemplo.
A criação do Gemini envolveu ainda o treinamento sobre o que não deve ser exibido aos usuários a partir de um conjunto de 100 mil frases consideradas tóxicas retiradas da internet. Um grupo de especialistas independentes também trabalha para testar os limites da nova IA.
“Estamos abordando esse trabalho com ousadia e responsabilidade”, disse Sundar Pichai, diretor-executivo da Alphabet, controladora do Google.
“Isso significa ser ambiciosos em nossa pesquisa e buscar capacidades que trarão benefícios enormes para as pessoas e a sociedade, ao mesmo tempo em que construímos salvaguardas e trabalhamos em colaboração com governos e especialistas para enfrentar os riscos à medida que a IA se torna mais capaz”, afirmou.
LEIA TAMBÉM:
Quem posta memes com fotos de terceiros pode ser processado? Entenda o que diz a lei
Cybertruck: como é o carro quase ‘inquebrável’ que a Tesla vende nos EUA
Elon Musk ataca anunciantes após boicote ao Twitter: ‘Vão se f…’
Voltar ao topo
Bard, o ‘ChatGPT do Google’, é lançado no Brasil