O lançamento do Google Gemini representa um marco importante no avanço da tecnologia de inteligência artificial (IA). Diferentemente dos modelos de IA tradicionais, que operam em domínios específicos, o Gemini é um modelo de IA multimodal capaz de processar e integrar de forma transparente diversos tipos de informações, incluindo texto, imagens, áudio, vídeo e código. Essa capacidade única decorre de seu design multimodal nativo, que permite que ele aprenda e raciocine sobre múltiplas modalidades simultaneamente, em vez de exigir componentes separados para cada uma.
Desempenho no MMLU estabelece um novo padrão
Um dos feitos mais impressionantes do Gemini é seu desempenho notável no Massive Multitasking Language Understanding (MMLU). Nesse benchmark, o Gemini Ultra, uma variante do modelo, alcançou uma pontuação MMLU de 90,0%, superando especialistas humanos pela primeira vez. Esse resultado sem precedentes demonstra a capacidade excepcional do Gemini de compreender e processar informações complexas de várias fontes.
O Google desenvolveu três versões distintas do Gemini para atender a uma ampla gama de necessidades:
- Gemini Ultra: A versão mais abrangente, projetada para tarefas altamente complexas que exigem amplas capacidades de conhecimento e raciocínio.
- Gemini Pro: Um modelo versátil capaz de lidar com um amplo espectro de aplicações, desde a geração de formatos de texto criativos até a tradução de idiomas.
- Gemini Nano: Otimizado para dispositivos móveis, permitindo que as capacidades de IA sejam integradas de forma transparente às experiências do usuário em movimento.
Ofertas iniciais e planos futuros
Atualmente, os consumidores têm a oportunidade de desenvolver aplicativos para dispositivos móveis e tablets usando o Gemini em duas versões: Gemini Nano e Gemini Pro. A versão mais avançada Gemini Ultra está atualmente reservada para desenvolvedores e empresas.
O Google está integrando o Gemini Ultra com o Bard, sua ferramenta de conversa popular, para aprimorar ainda mais as capacidades de interação com a linguagem natural.
O lançamento inicial do Gemini está focado em regiões de língua inglesa, com mais de 170 territórios cobertos, excluindo a Europa devido a considerações regulatórias em torno da IA. A empresa planeja expandir a disponibilidade do Gemini para mais idiomas e territórios no futuro.
Fonte: Wired