Resumo
Lançamos melhorias significativas nas capacidades de vídeo com IA e integração do Fiddl.art. Nosso novo servidor MCP permite que Apps do ChatGPT e outros clientes usem nossas ferramentas com os mesmos esquemas e faturamento da nossa API HTTP. O Sora v2 e v2 Pro agora oferecem suporte à preparação exata de imagem inicial com fallbacks inteligentes. A conversão de texto para fala (Text-to-Speech) agora faz streaming via SSE com menor latência. Também adicionamos OAuth 2.1, eventos do lado do servidor para o TikTok e páginas de SEO renderizadas na edge.
Servidor MCP: Ferramentas Padronizadas, Sem Surpresas
Nosso novo servidor de Protocolo de Contexto de Modelo (MCP) permite que clientes compatíveis, como os Apps do ChatGPT, chamem as mesmas ferramentas que nossos aplicativos web e móveis utilizam. O transporte usa SSE e JSON-RPC com suporte a streaming onde for benéfico.
Os principais recursos incluem paridade de ferramentas com as funções browse_creations, create_image, create_video e compra de mídia. Os mesmos esquemas de entrada, regras de faturamento e verificações de propriedade da nossa API HTTP são aplicados. Os clientes podem buscar nossa especificação OpenAPI para autoconfiguração, e a autenticação usa tokens JWT existentes para consistência entre os serviços.
A integração com OAuth 2.1 inclui descoberta, registro dinâmico de cliente, autorização PKCE e tokens de atualização (refresh tokens) rotativos e com hash, com uma interface de consentimento mínima. Os tokens são assinados com nossas chaves existentes para manter a compatibilidade da stack.
Sora v2 e v2 Pro: Imagens Iniciais Confiáveis e Pipelines Mais Rápidos
Adicionamos suporte completo para Sora v2 e Sora v2 Pro com processamento inteligente de imagem inicial. O sistema lida automaticamente com os requisitos de dimensionamento exatos: 720×1280 e 1280×720 para Sora v2, 1024×1792 e 1792×1024 para Sora v2 Pro.
Quando as proporções de tela correspondem, as imagens passam por um simples redimensionamento. Para proporções incompatíveis, o sistema gera um outpaint conservador, cobrado como uma geração de imagem padrão. O formato JPEG garante a estabilidade do decodificador, e o cache determinístico evita processamento redundante.
A integração com o provedor agora inclui uploads por streaming para saídas grandes e polling de status dedicado. A detecção de paralisação encerra automaticamente os trabalhos que ficam presos em altas porcentagens de conclusão por mais de 15 minutos. Também implementamos timestamps de exclusão lógica (soft-delete) e uma limpeza diária de originais com mais de 30 dias para otimizar o armazenamento.
Streaming de TTS via SSE
Nosso serviço de conversão de texto para fala (Text-to-Speech) agora faz streaming via Server-Sent Events, reduzindo significativamente a latência. Os clientes recebem primeiro os metadados, seguidos por blocos de áudio, eventos de progresso e sinais de conclusão. Eventos tipados simplificam a implementação no lado do cliente com categorização clara de eventos и tratamento de finalização.
Melhorias de Autenticação e Segurança
A autenticação agora usa um único token JWT para acesso tanto HTTP quanto MCP. Leituras públicas funcionam sem tokens, enquanto operações de escrita exigem verificação de propriedade. O armazenamento do OAuth aplica hash aos dados do cliente, códigos de autorização e refresh tokens, com imposição de PKCE quando aplicável.
A geração da OpenAPI ocorre na inicialização para manter a consistência entre a descoberta do MCP e as superfícies HTTP. Incluímos um exemplo de inspetor de CLI para otimizar os fluxos de trabalho de testes locais.
Melhorias em Analytics e Atribuição
Aprimoramos nossa infraestrutura de analytics com a integração de eventos do lado do servidor do TikTok. O sistema captura tokens de atribuição no lado do cliente, anexa-os a compras e eventos CompleteRegistration, e envia eventos do lado do servidor para melhorar as taxas de correspondência.
A implementação do Pixel agora usa novos IDs do Meta Pixel com inicialização mais segura e gerenciamento centralizado de eventos. Os Telegram Mini Apps contam com um runtime dedicado que evita scripts de terceiros quando incorporado, lida corretamente com o dimensionamento da viewport e integra os fluxos de compra de Stars com faturas nativas.
Atualizações de SEO e Documentação
Novas páginas renderizadas na edge para Eventos e Resgate de Código Promocional incluem marcação JSON-LD de FAQ e HowTo com cache controlado. Os sitemaps agora incorporam novas páginas e mídias públicas recentes para melhorar a descoberta de imagens e vídeos.
A documentação apresenta exemplos em múltiplos idiomas e orientação para registro de rotas. Nossa especificação OpenAPI reflete novos endpoints e atualizações de enumeração para uma melhor experiência do desenvolvedor.
Recursos para Criadores e Equipes
O treinamento de modelo personalizado mantém o suporte de ponta a ponta, com compatibilidade para a preparação de imagem inicial do Sora. O randomizador de modelos e os fluxos de trabalho de seleção múltipla agora fornecem estimativas de custo precisas para execuções públicas e privadas.
A funcionalidade de código de desconto permite que os compradores apliquem códigos com validação antecipada. Os administradores podem criar, atualizar, listar e excluir códigos, além de emitir pagamentos de afiliados com recibos.
Melhorias de Qualidade de Vida
A funcionalidade de comentários agora inclui operações CRUD completas, menções, contagens e notificações com camadas de consentimento para conteúdo NSFW para uma navegação segura. Os conjuntos de treinamento contam com conversão para WebP e criação de miniaturas no lado do cliente, com limites de arquivo e proteções de tamanho.
As estatísticas administrativas fornecem contadores ao vivo e gráficos compactos para monitorar o uso e as tendências de receita em toda a plataforma.
Como Começar
Para a integração com MCP, busque o recurso OpenAPI em nosso servidor MCP e registre as ferramentas com seu JWT existente no cabeçalho Authorization. As implementações do Sora precisam apenas fornecer uma imagem inicial — o sistema lida automaticamente com o redimensionamento ou com os outpaints em cache para atingir as resoluções alvo.
O streaming de TTS requer a conexão com o endpoint SSE e o tratamento sequencial dos eventos de metadados, áudio, progresso e conclusão. A validação do código de desconto deve ocorrer antes do checkout para garantir cálculos precisos em USD e pontos.
Desenvolvimentos Futuros
Estamos acompanhando os próximos trabalhos em nossos quadros de desenvolvimento públicos. Embora nenhum novo card tenha sido adicionado a "A Seguir" ou "Em Progresso" desde este lançamento, compartilharemos atualizações à medida que essas listas evoluírem. Nossa equipe de engenharia continua a aprimorar as capacidades do Fiddl.art para criação de arte com IA e treinamento de modelos personalizados.
Por Que Essas Atualizações São Importantes
Essas melhorias tornam o Fiddl.art mais fácil de integrar, mais rápido para iterar e mais transparente para operar. O servidor MCP elimina o "glue code" (código de ligação), os pipelines do Sora entregam um processamento previsível e ciente dos custos, e o streaming de TTS reduz a latência significativamente.
As equipes de marketing se beneficiam de uma atribuição aprimorada, os administradores ganham controles mais claros e os criadores acessam ferramentas mais confiáveis para a geração de arte com IA com modelos personalizados. Seja para construir um playground de arte com IA ou um gerador de 'face forge', essas atualizações ajudam você a avançar mais rápido e com menos surpresas.
Perguntas Frequentes
O que é o servidor MCP e como ele funciona com os Apps do ChatGPT?
Nosso servidor de Protocolo de Contexto de Modelo (MCP) permite que Apps do ChatGPT e outros clientes compatíveis acessem as ferramentas do Fiddl.art usando os mesmos esquemas e faturamento da nossa API HTTP. Ele utiliza transporte SSE e JSON-RPC com suporte a streaming onde for benéfico.
Como o Sora v2 lida com imagens iniciais com proporções de tela incorretas?
Quando as proporções de tela não correspondem aos requisitos do Sora, o sistema gera um outpaint conservador, cobrado como uma geração de imagem padrão. Para proporções correspondentes, ele realiza um simples redimensionamento. Ambas as abordagens usam cache determinístico para evitar processamento redundante.
Que vantagens o streaming de TTS oferece em relação às implementações anteriores?
O streaming via Server-Sent Events reduz significativamente a latência, permitindo que a reprodução comece com o primeiro bloco de áudio. O sistema de eventos tipados (metadados, áudio, progresso, concluído, erro) simplifica a implementação no lado do cliente e fornece um tratamento de finalização mais claro.
Como a integração de eventos do lado do servidor do TikTok melhora a atribuição?
O sistema captura tokens de atribuição no lado do cliente, anexa-os a eventos relevantes como compras e registros, e envia eventos do lado do servidor para o TikTok para melhorar as taxas de correspondência e um rastreamento de conversão mais preciso.
Modelos de IA personalizados podem funcionar com a geração de vídeo do Sora?
Sim, nosso sistema de treinamento de modelo personalizado mantém total compatibilidade com a preparação de imagem inicial do Sora. Os criadores podem treinar modelos usando nosso sistema Forge e usá-los de forma integrada com os pipelines do Sora v2 e v2 Pro.


