OpenAI e GPT: Novos modelos e produtos no Dev Day

AI Generativa Chat GPT Large Language Models LLMsLeave a Comment on OpenAI e GPT: Novos modelos e produtos no Dev Day

OpenAI e GPT: Novos modelos e produtos no Dev Day

A OpenAI compartilhou dezenas de novas adições e melhorias e reduzimos preços em muitas partes da plataforma. Esses incluem:

  • Novo modelo GPT-4 Turbo que é mais capaz, mais barato e suporta uma janela de contexto de 128K
  • Nova API Assistants que torna mais fácil para os desenvolvedores criarem seus próprios aplicativos assistivos de IA que têm objetivos e podem chamar modelos e ferramentas
  • Novas capacidades multimodais na plataforma, incluindo visão, criação de imagens (DALL·E 3) e conversão de texto em fala (TTS)

GPT-4 Turbo com contexto de 128K

Lançamos a primeira versão do GPT-4 em março e disponibilizamos o GPT-4 para todos os desenvolvedores em julho. Hoje estamos lançando uma prévia da próxima geração deste modelo, o GPT-4 Turbo .

O GPT-4 Turbo é mais capaz e tem conhecimento de eventos mundiais até abril de 2023. Possui uma janela de contexto de 128k para caber o equivalente a mais de 300 páginas de texto em um único prompt. Também foi otimizado seu desempenho para que possam oferecer o GPT-4 Turbo a um preço 3x mais barato para tokens de entrada e um preço 2x mais barato para tokens de saída em comparação com o GPT-4.

O GPT-4 Turbo está disponível para todos os desenvolvedores pagantes experimentarem passando gpt-4-1106-previewa API e planejamos lançar o modelo estável pronto para produção nas próximas semanas.

Atualizações de chamada de função

A chamada de função permite descrever funções do seu aplicativo ou APIs externas para modelos e fazer com que o modelo escolha de forma inteligente gerar um objeto JSON contendo argumentos para chamar essas funções. Estamos lançando diversas melhorias hoje, incluindo a capacidade de chamar múltiplas funções em uma única mensagem: os usuários podem enviar uma mensagem solicitando múltiplas ações, como “abrir a janela do carro e desligar o A/C”, o que anteriormente exigiria múltiplas ida e volta com o modelo ( saiba mais ). Também foi melhorada a precisão da chamada de função: é mais provável que o GPT-4 Turbo retorne os parâmetros de função corretos.

Seguimento de instruções aprimorado e modo JSON

O GPT-4 Turbo tem um desempenho melhor que nossos modelos anteriores em tarefas que exigem o seguimento cuidadoso de instruções, como a geração de formatos específicos (por exemplo, “responder sempre em XML”). Ele também oferece suporte ao nosso novo modo JSON , que garante que o modelo responderá com JSON válido. O novo parâmetro da API response_formatpermite que o modelo restrinja sua saída para gerar um objeto JSON sintaticamente correto. O modo JSON é útil para desenvolvedores que geram JSON na API Chat Completions fora da chamada de função.

Saídas reproduzíveis e probabilidades de log

O novo seedparâmetro permite resultados reproduzíveis , fazendo com que o modelo retorne conclusões consistentes na maioria das vezes. Esse recurso beta é útil para casos de uso como reprodução de solicitações de depuração, gravação de testes de unidade mais abrangentes e, geralmente, maior grau de controle sobre o comportamento do modelo.

A OpenAI tem usado esse recurso internamente para nossos próprios testes de unidade e o consideram inestimável.  Saber mais .

Também foi lançado um recurso para retornar as probabilidades de log para os tokens de saída mais prováveis ​​gerados pelo GPT-4 Turbo e GPT-3.5 Turbo nas próximas semanas, o que será útil para criar recursos como o preenchimento automático em uma experiência de pesquisa.

Turbo GPT-3.5 atualizado

Além do GPT-4 Turbo, também estamos lançando uma nova versão do GPT-3.5 Turbo que suporta uma janela de contexto de 16K por padrão. O novo 3.5 Turbo suporta instrução aprimorada, modo JSON e chamada de função paralela. Por exemplo, nossas avaliações internas mostram uma melhoria de 38% nas tarefas de seguimento de formato, como geração de JSON, XML e YAML.

Os desenvolvedores podem acessar esse novo modelo chamando gpt-3.5-turbo-1106a API. Os aplicativos que usam o gpt-3.5-turbonome serão atualizados automaticamente para o novo modelo em 11 de dezembro. Os modelos mais antigos continuarão acessíveis por meio gpt-3.5-turbo-0613da API até 13 de junho de 2024. Saiba mais .

API de assistentes, recuperação e intérprete de código

Hoje estamos lançando a API Assistants , nosso primeiro passo para ajudar os desenvolvedores a criar experiências semelhantes às dos agentes em seus próprios aplicativos. Um assistente é uma IA desenvolvida especificamente que possui instruções específicas, aproveita conhecimento extra e pode chamar modelos e ferramentas para executar tarefas. A nova API de assistentes fornece novos recursos, como intérprete e recuperação de código, bem como chamadas de função para lidar com grande parte do trabalho pesado que você mesmo tinha que fazer anteriormente e permitir a criação de aplicativos de IA de alta qualidade.

Esta API foi projetada para oferecer flexibilidade; os casos de uso variam de um aplicativo de análise de dados baseado em linguagem natural, um assistente de codificação, um planejador de férias com tecnologia de AI, um DJ controlado por voz, uma tela visual inteligente – a lista continua. A API Assistants é baseada nos mesmos recursos que habilitam nosso novo produto GPTs : instruções e ferramentas personalizadas, como intérprete de código, recuperação e chamada de função.

Uma mudança importante introduzida por esta API são os threads persistentes e infinitamente longos , que permitem aos desenvolvedores transferir o gerenciamento do estado do thread para o OpenAI e contornar as restrições da janela de contexto. Com a API Assistants, basta adicionar cada nova mensagem a um arquivo thread.

Os assistentes também têm acesso para chamar novas ferramentas conforme necessário, incluindo:

  • Intérprete de código : escreve e executa código Python em um ambiente de execução em sandbox, podendo gerar gráficos e tabelas e processar arquivos com dados e formatações diversos. Ele permite que seus assistentes executem código iterativamente para resolver problemas desafiadores de código e matemática e muito mais.
  • Recuperação : amplia o assistente com conhecimento externo aos nossos modelos, como dados de domínio proprietário, informações de produtos ou documentos fornecidos por seus usuários. Isso significa que você não precisa calcular e armazenar embeddings para seus documentos ou implementar algoritmos de segmentação e pesquisa. A API Assistants otimiza qual técnica de recuperação usar com base em nossa experiência na construção de recuperação de conhecimento no ChatGPT.
  • Chamada de função : permite que os assistentes invoquem funções definidas por você e incorporem a resposta da função em suas mensagens.

Tal como acontece com o resto da plataforma, os dados e arquivos passados ​​para a API OpenAI nunca são usados ​​para treinar nossos modelos e os desenvolvedores podem excluir os dados quando acharem adequado.

Você pode experimentar a versão beta da API Assistants sem escrever nenhum código acessando o playground do Assistants .

Use o playground de Assistentes para criar assistentes de alta qualidade sem código.

A API Assistants está em versão beta e disponível para todos os desenvolvedores a partir de hoje. Compartilhe o que você construiu conosco ( @OpenAI ) junto com seus comentários, que incorporaremos à medida que continuarmos construindo nas próximas semanas. Os preços das APIs Assistants e suas ferramentas estão disponíveis em nossa página de preços .

Novas modalidades na API

Leave a Reply

Your email address will not be published. Required fields are marked *

Back To Top