Desde ontem, o ChatGPT está mais poderoso do que nunca. Isso porque a OpenAI, empresa desenvolvedora do chatbot, anunciou o lançamento do modelo GPT-4o, que alimenta a funcionalidade de Inteligência Artificial. A novidade é que, agora, o ChatGPT consegue entender não só comandos textuais – como já ocorria – mas também áudio, imagem e documentos. Mas foi o anúncio de uma outra funcionalidade que roubou a atenção: a possibilidade de tornar o ChatGPT um assistente virtual que compreende comandos de voz e analisa vídeos em tempo real, parecido com o que previu o filme de ficção científica Her.
As atualizações foram apresentadas em um evento realizado nesta segunda-feira (13) nos Estados Unidos. Durante a transmissão, os engenheiros e chefes de pesquisa da OpenAI demonstraram as novas capacidades do ChatGPT. Nos testes, os pesquisadores conversaram com a funcionalidade, que se tornou uma espécie de assistente virtual como Alexa, da Amazon, e pediram para que ela inventasse histórias para dormir.
Em um outro momento, eles pediram para que o assistente olhasse as imagens captadas pela câmera do celular e descrevesse o que estava visível na tela, além de atuar como um tradutor em tempo real entre conversas faladas em diferentes idiomas.
O The Verge comparou a funcionalidade apresentada com a tecnologia retratada no filme Her, dirigido por Spike Jonze e lançado em 2014. No longa, uma tecnologia de IA capaz de conversar e até mesmo ver o ambiente em que o usuário se encontra é uma das personagens principais da história. “A resposta de voz da assistente [da OpenAI] tinha uma notável semelhança com a personagem que Scarlett Johansson interpreta no filme Her, onde um homem estabelece um relacionamento com uma sofisticada assistente de IA”, escreveu o veículo norte-americano.
Apesar disso, a diretora de tecnologia da empresa, Mira Murati, desmentiu as relações entre a IA do filme com as atualizações lançadas. “Alguém me fez exatamente a mesma pergunta na plateia e então disse: ‘Ah, talvez a razão pela qual eu não a reconheci no ChatGPT seja porque a voz tem muita personalidade e tonalidade”, disse Murati ao site.
Sobre os lançamentos da OpenAI, Ronaldo Lemos, diretor do Instituto de Tecnologia e Sociedade do Rio de Janeiro, comentou que este é o primeiro passo para que a IA se torne uma espécie de sistema operacional do mundo. “A IA se tornando parte do cotidiano, seja em interações síncronas, seja por meio de APIs se integrando a outros serviços”, afirmou Lemos no perfil do X.
GTP-4o é mais rápido e faz pesquisas na web
De acordo com a OpenAI, o novo modelo é mais rápido que o anterior e consegue navegar pelos sites da web para procurar informações em tempo real. A atualização de texto e imagem já está disponível tanto para usuários pagantes como para aqueles que acessam gratuitamente. O novo modo de voz do GTP-4 chegará nas próximas semanas.
Os assinantes, porém, terão uma versão com limites cinco vezes maiores que aquela disponibilizada gratuitamente, conforme disse Mira Murat, diretora de tecnologia da empresa, no evento de lançamento realizado nos Estados Unidos nesta segunda-feira (13).
No blog oficial, a empresa afirma que o GPT-4o é “um passo em direção a uma interação humano-computador muito mais natural – ele aceita como entrada qualquer combinação de texto, áudio e imagem e gera qualquer combinação de saídas de texto, áudio e imagem”.
Um novo aplicativo do ChatGPT para computadores, a abertura de uma API mais barata e acessível aos desenvolvedores e o acesso gratuito à loja de GPTs, com chatbots personalizados, também foram anunciados no evento de segunda-feira.
Google anuncia aplicação de IA em seus produtos
Nesta terça-feira (14), foi a vez do Google anunciar suas novidades sobre IA no evento Goole I/O, também realizado nos Estados Unidos e transmitido online. Além de aplicação da tecnologia em funcionalidades como Gmail, Google Maps e Android, a empresa apresentou atualizações do Gemini, seu chatbot inteligente, muito parecidas com as divulgadas pela OpenAI. Isso porque com a nova versão, chamada de Gemini 1.5, a funcionalidade também conseguirá entender documentos mais extensos, vídeos e áudios, além do texto. Já com o Gemini Live, o usuário conseguirá ter conversas com a IA por meio dos seus celulares.
Uma IA generativa de vídeos hiper-realistas também foi anunciada. A Veo será capaz de criar clipes em alta definição em poucos minutos a partir de comandos de texto. A funcionalidade vem para competir diretamente com a Sora, da OpenAI. As atualizações e lançamentos feitos pela bigtech nesta terça foram listadas e descritas pelo portal TechCrunh.