ChatGPT agora tem opção de áudio: descubra como usar
Nesta segunda-feira (13), a OpenAI anunciou o lançamento do GPT-4o, a mais recente versão do modelo de inteligência artificial (IA) utilizado no popular robô conversador ChatGPT. Esta versão representa um marco para a OpenAI, pois é a primeira a incorporar de forma autônoma texto, imagens e áudio em tempo real.
Segundo informações da empresa, o GPT-4o demonstra uma habilidade superior em compreender esses tipos de conteúdo em relação ao seu antecessor, o GPT-4, que foi lançado em março de 2023 e está disponível apenas por meio de pagamento.
Atualização do ChatGPT
A atualização será disponibilizada progressivamente para todos os usuários, abrangendo também aqueles que utilizam a versão gratuita. A principal inovação da nova versão é a capacidade de interagir com o robô através de comandos de voz, viabilizando uma interação mais fluida e imediata, sem depender exclusivamente da digitação.
Para ilustrar as habilidades do GPT-4o, a OpenAI divulgou um vídeo em que alguém pede ao ChatGPT para avaliar seu traje para uma entrevista de emprego. Em outro experimento, o modelo foi empregado na criação de música.
Antes, o ChatGPT precisava passar por várias fases para processar e responder aos comandos de voz. Com o GPT-4o, houve uma notável redução no tempo de resposta para comandos de áudio, com uma média de 320 milissegundos, e um mínimo de 232 milissegundos. Isso representa uma melhoria significativa em relação aos modelos anteriores, como o GPT-3.5, que levava em média 2,8 segundos para responder, e o GPT-4, que demandava 5,4 segundos.
Opções de uso
De acordo com a OpenAI, o GPT-4o é um modelo completo em texto, visão e áudio, o que implica que todas as entradas e saídas são tratadas pela mesma rede neural. Sam Altman elogiou o GPT-4o como o mais avançado modelo já criado pela OpenAI, destacando sua inteligência, velocidade e habilidades multimodais.
Além das versões para navegadores, Android e iOS, a OpenAI também introduziu um aplicativo do ChatGPT para computador. Os recursos de texto e imagem do GPT-4o já foram liberados e os desenvolvedores podem agora incorporá-los em suas próprias aplicações.
Veja também: Dona do ChatGPT, Open IA proíbe uso da ferramenta em campanhas eleitorais
Liberação de acesso
Os utilizadores da versão gratuita do ChatGPT poderão aceder aos recursos, embora com um limite de mensagens não especificado, enquanto os subscritores do ChatGPT Plus terão um limite mais elevado. O acesso aos comandos de voz será disponibilizado para os subscritores do ChatGPT Plus nas semanas seguintes.
A OpenAI não especificou a data de lançamento dos recursos de vídeo para todos os usuários, mas mencionou que serão disponibilizados inicialmente para um grupo selecionado de desenvolvedores parceiros.