TLDR
Hemos lanzado mejoras significativas en las capacidades de video con IA e integración de Fiddl.art. Nuestro nuevo servidor MCP permite que las Apps de ChatGPT y otros clientes usen nuestras herramientas con los mismos esquemas y facturación que nuestra API HTTP. Sora v2 y v2 Pro ahora admiten la preparación exacta de imágenes de inicio con alternativas inteligentes. El servicio de texto a voz transmite por SSE con menor latencia. También hemos añadido OAuth 2.1, eventos del lado del servidor para TikTok y páginas de SEO renderizadas en el edge.
Servidor MCP: Herramientas estándar, cero sorpresas
Nuestro nuevo servidor MCP (Model Context Protocol) permite que clientes compatibles con MCP, como las Apps de ChatGPT, invoquen las mesmas herramientas que usan nuestras aplicaciones web y móviles. El transporte utiliza SSE más JSON-RPC, con soporte para streaming donde sea beneficioso.
Las características clave incluyen paridad de herramientas con las funciones browse_creations, create_image, create_video y de compra de medios. Se aplican los mismos esquemas de entrada, reglas de facturación y verificaciones de propiedad que en nuestra API HTTP. Los clientes pueden obtener nuestra especificación OpenAPI para autoconfigurarse, y la autenticación utiliza los tokens JWT existentes para mantener la coherencia entre servicios.
La integración de OAuth 2.1 incluye descubrimiento, registro dinámico de clientes, autorización PKCE y tokens de actualización rotatorios y hasheados con una interfaz de consentimiento mínima. Los tokens se firman con nuestras claves existentes para mantener la compatibilidad del stack.
Sora v2 y v2 Pro: Imágenes de inicio fiables y pipelines más rápidos
Hemos añadido soporte de primera clase para Sora v2 y Sora v2 Pro con un manejo inteligente de las imágenes de inicio. El sistema gestiona automáticamente los requisitos de tamaño exactos: 720×1280 y 1280×720 para Sora v2, 1024×1792 y 1792×1024 para Sora v2 Pro.
Cuando las relaciones de aspecto coinciden, las imágenes simplemente se redimensionan. Para relaciones de aspecto que no coinciden, el sistema genera una expansión de imagen (outpainting) conservadora, que se factura como una generación de imagen estándar. El formato JPEG garantiza la estabilidad del decodificador y el almacenamiento en caché determinista evita el procesamiento redundante.
La integración con el proveedor ahora incluye subidas por streaming para resultados grandes y sondeo de estado (polling) dedicado. La detección de estancamiento marca como erróneos automáticamente los trabajos que se quedan atascados en porcentajes de finalización altos durante más de 15 minutos. También hemos implementado marcas de tiempo para eliminación lógica (soft-delete) y una purga diaria de los originales con más de 30 días de antigüedad para optimizar el almacenamiento.
TTS por streaming sobre SSE
Nuestro servicio de texto a voz ahora transmite mediante Server-Sent Events (SSE), reduciendo la latencia de forma significativa. Los clientes reciben primero los metadatos, seguidos de fragmentos de audio, eventos de progreso y señales de finalización. Los eventos tipados simplifican la implementación en el cliente con una categorización de eventos clara y un manejo de la terminación.
Mejoras de autenticación y seguridad
La autenticación ahora utiliza un único token JWT tanto para el acceso HTTP como para el MCP. Las lecturas públicas funcionan sin token, mientras que las escrituras requieren verificación de propiedad. El almacenamiento de OAuth aplica hash a los datos del cliente, los códigos de autorización y los tokens de actualización, con aplicación de PKCE cuando corresponde.
La generación de la especificación OpenAPI se realiza al iniciar para mantener la coherencia between el descubrimiento de MCP y las interfaces HTTP. Hemos incluido un ejemplo de inspector de CLI para agilizar los flujos de trabajo de pruebas locales.
Mejoras en analíticas y atribución
Hemos mejorado nuestra infraestructura de analíticas con la integración de eventos del lado del servidor de TikTok. El sistema captura los tokens de atribución en el lado del cliente, los adjunta a las compras y a los eventos CompleteRegistration, y envía eventos del lado del servidor para mejorar las tasas de coincidencia (match rates).
La implementación del píxel ahora utiliza nuevos ID de Meta Pixel con una inicialización más segura y una gestión de eventos centralizada. Las Mini Apps de Telegram cuentan con un tiempo de ejecución (runtime) dedicado que evita scripts de terceros cuando se incrustan, gestiona correctamente el tamaño del viewport e integra los flujos de compra de Stars con facturas nativas.
Actualizaciones de SEO y documentación
Las nuevas páginas renderizadas en el edge para Eventos y Canje de Códigos Promocionales incluyen marcado JSON-LD para FAQ y HowTo con almacenamiento en caché controlado. Los sitemaps ahora incorporan las nuevas páginas y los medios públicos recientes para mejorar el descubrimiento de imágenes y videos.
La documentación incluye ejemplos en varios idiomas y guías para el registro de rutas (router-registration). Nuestra especificación OpenAPI refleja los nuevos endpoints y las actualizaciones de enumeraciones para una mejor experiencia de desarrollador.
Funcionalidades para creadores y equipos
El entrenamiento de modelos personalizados mantiene el soporte de extremo a extremo con compatibilidad para la preparación de imágenes de inicio de Sora. El aleatorizador de modelos y los flujos de trabajo con selección múltiple ahora proporcionan estimaciones de costos precisas tanto para ejecuciones públicas como privadas.
La funcionalidad de códigos de descuento permite a los compradores aplicar códigos con validación por adelantado. Los administradores pueden crear, actualizar, listar y eliminar códigos, así como emitir pagos a afiliados con sus correspondientes recibos.
Mejoras prácticas y de usabilidad
La funcionalidad de comentarios ahora incluye operaciones CRUD completas, menciones, contadores y notificaciones, con capas de consentimiento NSFW para una navegación segura. Los conjuntos de entrenamiento (training sets) ahora incluyen conversión a WebP y generación de miniaturas en el lado del cliente, con límites de archivos y protecciones de tamaño.
Las estadísticas administrativas proporcionan contadores en tiempo real y gráficos compactos para monitorear el uso y las tendencias de ingresos en toda la plataforma.
Para empezar
Para la integración con MCP, obtén el recurso OpenAPI de nuestro servidor MCP y registra las herramientas con tu JWT existente en la cabecera Authorization. Las implementaciones de Sora solo necesitan proporcionar una imagen de inicio; el sistema se encarga automáticamente del redimensionamiento o de las expansiones (outpaints) cacheadas para alcanzar las resoluciones objetivo.
El streaming de TTS requiere conectarse al endpoint de SSE y gestionar secuencialmente los eventos de metadatos, audio, progreso y finalización. La validación del código de descuento debe realizarse antes de finalizar la compra para asegurar que los cálculos en USD y puntos sean precisos.
Desarrollos futuros
Estamos haciendo seguimiento del trabajo futuro en nuestros tableros de desarrollo públicos. Aunque no se han añadido nuevas tarjetas a "Up Next" o "In Progress" desde este lanzamiento, compartiremos actualizaciones a medida que estas listas evolucionen. Nuestro equipo de ingeniería continúa mejorando las capacidades de Fiddl.art para la creación de arte con IA y el entrenamiento de modelos personalizados.
Por qué estas actualizaciones son importantes
Estas mejoras hacen que Fiddl.art sea más fácil de integrar, más rápido para iterar y más transparente en su funcionamiento. El servidor MCP elimina el código de acoplamiento (glue code), los pipelines de Sora ofrecen un procesamiento predecible y consciente de los costos, y el TTS por streaming reduce la latencia de forma significativa.
Los equipos de marketing se benefician de una mejor atribución, los administradores obtienen controles más claros y los creadores acceden a herramientas más fiables para la generación de arte con IA con modelos personalizados. Ya sea que estés construyendo un playground de arte con IA o un generador de forja de rostros, estas actualizaciones ayudan a avanzar más rápido y con menos sorpresas.
Preguntas frecuentes
¿Qué es el servidor MCP y cómo funciona con las Apps de ChatGPT?
Nuestro servidor MCP (Model Context Protocol) permite que las Apps de ChatGPT y otros clientes compatibles con MCP accedan a las herramientas de Fiddl.art utilizando los mismos esquemas y facturación que nuestra API HTTP. Utiliza un transporte SSE más JSON-RPC con soporte para streaming donde sea beneficioso.
¿Cómo gestiona Sora v2 las imágenes de inicio con relaciones de aspecto incorrectas?
Cuando las relaciones de aspecto no coinciden con los requisitos de Sora, el sistema genera una expansión de imagen (outpainting) conservadora, que se factura como una generación de imagen estándar. Para las relaciones de aspecto que sí coinciden, realiza un simple redimensionamiento. Ambos métodos utilizan el almacenamiento en caché determinista para evitar el procesamiento redundante.
¿Qué ventajas ofrece el TTS por streaming en comparación con las implementaciones anteriores?
La transmisión mediante Server-Sent Events (SSE) reduce significativamente la latencia al permitir que la reproducción comience con el primer fragmento de audio. El sistema de eventos tipados (metadatos, audio, progreso, finalizado, error) simplifica la implementación en el cliente y proporciona un manejo más claro de la terminación.
¿Cómo mejora la atribución la integración de eventos del lado del servidor de TikTok?
El sistema captura los tokens de atribución en el lado del cliente, los adjunta a eventos relevantes como compras y registros, y envía eventos del lado del servidor a TikTok para mejorar las tasas de coincidencia y obtener un seguimiento de conversiones más preciso.
¿Pueden los modelos de IA personalizados funcionar con la generación de video de Sora?
Sí, nuestro sistema de entrenamiento de modelos personalizados mantiene una compatibilidad total con la preparación de imágenes de inicio de Sora. Los creadores pueden entrenar modelos utilizando nuestro sistema Forge y usarlos sin problemas con los pipelines de Sora v2 y v2 Pro.
