Sora 来了！

一文速览

我们为 Fiddl.art 的 AI 视频和集成功能发布了重大升级。全新的 MCP 服务器让 ChatGPT Apps 及其他客户端可以使用与我们的 HTTP API 相同的模式和计费方式来调用我们的工具。Sora v2 和 v2 Pro 现已支持精确的起始图像准备功能及智能回退机制。文本转语音 (TTS) 功能通过 SSE 进行流式传输，延迟更低。此外，我们还新增了 OAuth 2.1、TikTok 服务器端事件和边缘渲染的 SEO 页面。

MCP 服务器：标准工具，可预见的结果

我们全新的模型上下文协议 (MCP) 服务器，让 ChatGPT Apps 等兼容 MCP 的客户端可以调用我们 Web 和移动应用所使用的相同工具。其传输层采用 SSE 加 JSON-RPC 的方式，并在适当场景下支持流式传输。

主要功能包括与 browse_creations、create_image、create_video 和媒体购买功能实现工具对等。其输入模式、计费规则和所有权检查与我们的 HTTP API 保持一致。客户端可以获取我们的 OpenAPI 规范进行自我配置，认证则使用现有的 JWT 令牌以确保跨服务的一致性。

OAuth 2.1 集成包括服务发现、动态客户端注册、PKCE 授权以及带有最简化同意界面的轮替哈希刷新令牌。令牌使用我们现有的密钥进行签名，以保持技术栈的兼容性。

Sora v2 和 v2 Pro：可靠的起始图像和更快的处理管线

我们为 Sora v2 和 Sora v2 Pro 增添了原生支持，并配备了智能的起始图像处理功能。系统会自动处理精确的尺寸要求：Sora v2 为 720×1280 和 1280×720，Sora v2 Pro 为 1024×1792 和 1792×1024。

当宽高比匹配时，系统会对图像进行简单的尺寸调整。如果宽高比不匹配，系统会生成一个保守的外绘制图像，并按标准图像生成服务计费。我们采用 JPEG 格式以确保解码器的稳定性，并通过确定性缓存来避免冗余处理。

提供商集成现已包括针对大文件的流式上传和专用的状态轮询。停滞检测功能会自动将完成度很高但卡住超过 15 分钟的任务标记为错误。我们还实现了软删除时间戳，并每日清理超过 30 天的原始文件以优化存储。

通过 SSE 进行流式文本转语音

我们的文本转语音 (TTS) 服务现通过服务器发送事件 (SSE) 进行流式传输，从而显著降低延迟。客户端会首先收到元数据，随后是音频数据块、进度事件和完成信号。类型化的事件通过清晰的事件分类和终止处理，简化了客户端的实现。

认证与安全增强

认证现使用单个 JWT 令牌，同时支持 HTTP 和 MCP 访问。公开读取无需令牌，但写入操作需要所有权验证。OAuth 存储会对客户端数据、授权码和刷新令牌进行哈希处理，并酌情强制执行 PKCE。

OpenAPI 规范在启动时生成，以保持 MCP 发现机制和 HTTP 接口之间的一致性。我们还提供了一个 CLI 检查器示例，以简化本地测试工作流。

分析与归因改进

我们通过集成 TikTok 服务器端事件，增强了我们的分析基础设施。系统会在客户端捕获归因令牌，将其附加到购买和“完成注册”等事件上，并发送服务器端事件以提高匹配率。

Pixel 实现现在使用新的 Meta Pixel ID，具有更安全的初始化和集中式事件管理。Telegram Mini Apps 采用专用运行时，在嵌入时可避免使用第三方脚本，能正确处理视口尺寸，并将 Stars 购买流程与原生发票集成。

SEO 与文档更新

我们为“活动”和“优惠码兑换”页面新增了边缘渲染支持，其中包含带有受控缓存的 JSON-LD FAQ 和 HowTo 标记。站点地图现已包含新页面和最近的公开媒体，以改善图像和视频的发现效果。

文档部分增加了多语言示例和路由器注册指南。我们的 OpenAPI 规范也反映了新的端点和枚举更新，以提供更好的开发者体验。

创作者与团队功能

自定义模型训练保持端到端支持，并与 Sora 的起始图像准备功能兼容。模型随机选择器和多选工作流现在能为公开和私有运行提供准确的成本估算。

优惠码功能允许买家在购买前应用并验证代码。管理员可以创建、更新、列出和删除代码，同时可以处理联盟分销支付并提供收据。

易用性改进

评论功能现已支持完整的 CRUD 操作、@提及、计数和通知，并带有 NSFW 内容同意浮层，以确保安全浏览。训练集功能支持客户端 WebP 转换和缩略图生成，并设有文件数量和大小限制。

管理后台统计功能提供实时计数器和紧凑图表，用于监控整个平台的使用情况和收入趋势。

快速上手

如需进行 MCP 集成，请从我们的 MCP 服务器获取 OpenAPI 资源，并在 Authorization 头中使用您现有的 JWT 来注册工具。使用 Sora 时，只需提供一张起始图像——系统会自动处理尺寸调整或通过缓存的外绘制来匹配目标分辨率。

要使用流式 TTS，需要连接到 SSE 端点，并按顺序处理元数据、音频、进度和完成事件。优惠码验证应在结账前进行，以确保美元和积分计算的准确性。

未来开发计划

我们正在公开的开发看板上追踪即将进行的工作。自本次发布以来，Up Next 和 In Progress 列表没有新增任何卡片，但随着这些列表的更新，我们会及时分享进展。我们的工程团队将继续增强 Fiddl.art 在 AI 艺术创作和自定义模型训练方面的能力。

为何这些更新至关重要

这些增强功能使 Fiddl.art 的集成更轻松、迭代更快速、运营更透明。MCP 服务器消除了胶水代码，Sora 处理管线提供了可预测且成本可知的处理，而流式 TTS 则显著降低了延迟。

市场营销团队将受益于改进的归因分析，管理员能获得更清晰的控制功能，创作者则能使用更可靠的工具进行 AI 艺术生成和自定义模型训练。无论您是在构建一个 AI 艺术游乐场还是换脸生成器，这些更新都将帮助您以更快的速度前进，减少意外。

常见问题解答

什么是 MCP 服务器？它如何与 ChatGPT Apps 协同工作？

我们的模型上下文协议 (MCP) 服务器允许 ChatGPT Apps 和其他兼容 MCP 的客户端使用与我们的 HTTP API 相同的模式和计费方式来访问 Fiddl.art 的工具。它采用 SSE 加 JSON-RPC 的传输方式，并在适当场景下支持流式传输。

Sora v2 如何处理宽高比不正确的起始图像？

当宽高比不符合 Sora 的要求时，系统会生成一个保守的外绘制图像，并按标准图像生成服务计费。如果宽高比匹配，系统则会进行简单的尺寸调整。两种方法都使用确定性缓存来避免冗余处理。

与之前的实现相比，流式 TTS 有什么优势？

通过服务器发送事件 (SSE) 进行流式传输，允许客户端在收到第一个音频块时就开始播放，从而显著降低延迟。类型化的事件系统（元数据、音频、进度、完成、错误）简化了客户端的实现，并提供了更清晰的终止处理。

TikTok 服务器端事件集成如何改进归因分析？

系统会在客户端捕获归因令牌，将其附加到购买和注册等相关事件上，并向 TikTok 发送服务器端事件，从而提高匹配率和转化跟踪的准确性。

自定义 AI 模型可以用于 Sora 视频生成吗？

可以，我们的自定义模型训练系统与 Sora 的起始图像准备功能完全兼容。创作者可以使用我们的 Forge 系统训练模型，并将其无缝用于 Sora v2 和 v2 Pro 的处理管线。

Available languages