TLDR

Fiddl.artのAI動画生成機能と外部連携機能を大幅にアップデートしました。新しいMCPサーバーにより、ChatGPT Appsなどのクライアントが、私たちのHTTP APIと同じスキーマと課金体系でツールを利用できます。Sora v2およびv2 Proは、スマートなフォールバック機能を備えた、正確な開始画像の準備に対応しました。テキスト読み上げ(TTS)機能はSSE経由のストリーミングに対応し、遅延がさらに低減されています。その他、OAuth 2.1、TikTokのサーバーサイドイベント、エッジレンダリングによるSEO向けページなども追加しました。

MCPサーバー:標準化されたツールで、導入もスムーズに

新しいModel Context Protocol (MCP) サーバーにより、ChatGPT AppsのようなMCP互換クライアントが、私たちのWebアプリやモバイルアプリと同じツールを呼び出せるようになります。通信にはSSEとJSON-RPCを使用し、メリットがある箇所ではストリーミングにも対応しています。

主な特徴として、browse_creationscreate_imagecreate_video、メディア購入機能など、既存のツールとの完全な機能パリティが挙げられます。HTTP APIと同じ入力スキーマ、課金ルール、所有権チェックが適用されます。クライアントは自己設定のためにOpenAPI仕様を取得でき、認証には既存のJWTトークンを使用するため、サービス間での一貫性が保たれます。

OAuth 2.1連携には、ディスカバリー、動的クライアント登録、PKCEによる認可、そして最小限の同意UIでハッシュ化されたリフレッシュトークンをローテーションする機能が含まれます。既存のキーでトークンに署名することで、スタックの互換性を維持しています。

Sora v2およびv2 Pro:信頼性の高い開始画像と高速化されたパイプライン

Sora v2とSora v2 Proに正式対応し、インテリジェントな開始画像処理機能を追加しました。Sora v2では720×1280と1280×720、Sora v2 Proでは1024×1792と1792×1024といった、それぞれの正確なサイズ要件にシステムが自動で対応します。

アスペクト比が一致する場合、画像は単純なリサイズが行われます。アスペクト比が一致しない場合は、通常の画像生成として課金される、控えめなアウトペインティング(画像の拡張)が生成されます。JPEG形式を使用することでデコーダーの安定性を確保し、決定論的なキャッシュにより冗長な処理を回避します。

プロバイダー連携には、大容量の出力に対応するストリーミングアップロードと、専用のステータスポーリングが含まれるようになりました。15分以上高い完了率で停止しているジョブを自動的にエラーとして処理する、ストール検出機能も実装しました。また、ソフトデリート用のタイムスタンプと、30日以上経過したオリジナルデータを毎日パージ(削除)する機能により、ストレージを最適化しています。

SSEによるTTSのストリーミング対応

テキスト読み上げ(TTS)サービスが、サーバー送信イベント(SSE)経由でのストリーミングに対応し、遅延を大幅に削減しました。クライアントは最初にメタデータを受け取り、続いて音声チャンク、進捗イベント、完了シグナルを受け取ります。型付けされたイベントにより、イベントのカテゴリ分類と終了処理が明確になり、クライアント側の実装が簡素化されます。

認証とセキュリティの強化

認証には、HTTPとMCPの両方のアクセスに単一のJWTトークンを使用するようになりました。パブリックな読み取りはトークンなしで可能ですが、書き込みには所有権の検証が必要です。OAuthストレージでは、クライアントデータ、認証コード、リフレッシュトークンがハッシュ化され、該当する場合にはPKCEが強制されます。

MCPのディスカバリーとHTTPのエンドポイント間の一貫性を保つため、OpenAPIの仕様は起動時に生成されます。ローカルでのテストワークフローを効率化するため、CLIインスペクターのサンプルも用意しました。

分析とアトリビューションの改善

TikTokのサーバーサイドイベント連携により、分析インフラを強化しました。システムはクライアント側でアトリビューショントークンをキャプチャし、購入やCompleteRegistrationイベントに添付、サーバーサイドイベントとして送信することで、マッチ率を向上させています。

ピクセル実装には新しいMeta Pixel IDを使用し、より安全な初期化と一元的なイベント管理を行うようになりました。Telegram Mini Apps向けには、埋め込み時にサードパーティ製スクリプトを回避し、ビューポートのサイズを適切に処理し、Starsによる購入フローをネイティブの請求書と統合する専用ランタイムを搭載しました。

SEOとドキュメントの更新

イベントページとプロモーションコード申請ページがエッジレンダリングで新たに提供され、JSON-LD形式のFAQやHowToマークアップに対応し、キャッシュも制御されています。サイトマップには新しいページと最近の公開メディアが追加され、画像や動画の検索流入の改善が期待できます。

ドキュメントには、多言語のサンプルコードやルーター登録のガイダンスが追加されました。OpenAPI仕様も更新され、新しいエンドポイントや列挙型の変更が反映されており、開発者体験が向上しています。

クリエイターとチーム向け機能

カスタムモデルの学習機能は、Soraの開始画像準備との互換性を備え、エンドツーエンドでサポートされます。モデルランダマイザーと複数選択ワークフローで、公開・非公開の両方の実行に対して正確なコスト見積もりが表示されるようになりました。

割引コード機能により、購入者は事前のバリデーション付きでコードを適用できます。管理者は、コードの作成、更新、一覧表示、削除が可能で、アフィリエイトへの支払いと領収書の発行も行えます。

QoL(Quality of Life)の向上

コメント機能に、完全なCRUD操作、メンション、件数表示、通知機能が追加されました。安全なブラウジングのため、NSFWコンテンツには同意確認のオーバーレイが表示されます。学習セットでは、クライアントサイドでのWebP変換とサムネイル生成、ファイル数制限、サイズガード機能が利用できます。

管理者向けの統計情報として、プラットフォーム全体の使用状況や収益トレンドを監視するためのライブカウンターとコンパクトなチャートが提供されます。

はじめに

MCPと連携するには、MCPサーバーからOpenAPIリソースを取得し、既存のJWTをAuthorizationヘッダーに設定してツールを登録します。Soraを利用する際は、開始画像を指定するだけです。システムが自動でリサイズやキャッシュされたアウトペインティングを行い、ターゲット解像度に合わせます。

TTSストリーミングを利用するには、SSEエンドポイントに接続し、メタデータ、音声、進捗、完了イベントを順番に処理する必要があります。割引コードのバリデーションは、正確なUSDとポイント計算のため、チェックアウト前に行うようにしてください。

今後の開発について

今後の開発予定は、公開されている開発ボードで追跡しています。このリリース以降、「Up Next」や「In Progress」に新しいカードは追加されていませんが、リストの進捗に合わせて最新情報をお届けします。私たちのエンジニアリングチームは、AIアート制作とカスタムモデル学習のため、Fiddl.artの機能強化を続けています。

今回のアップデートが重要な理由

これらの機能強化により、Fiddl.artはより統合しやすく、より速くイテレーションでき、より透明性の高い運用が可能になります。MCPサーバーは連携のための「つなぎ」のコードを不要にし、Soraのパイプラインは予測可能でコストを意識した処理を実現し、TTSストリーミングは遅延を大幅に削減します。

マーケティングチームはアトリビューションの向上から恩恵を受け、管理者はより明確な管理機能を手に入れ、クリエイターはカスタムモデルを使ったAIアート生成のための信頼性の高いツールを利用できます。AIアートのプレイグラウンドを構築している場合でも、顔写真の合成ジェネレーターを開発している場合でも、今回のアップデートは、予期せぬ問題を減らし、開発を加速させるのに役立ちます。

よくある質問

MCPサーバーとは何ですか?また、ChatGPT Appsとはどのように連携するのですか?

Model Context Protocol(MCP)サーバーは、ChatGPT AppsなどのMCP互換クライアントが、私たちのHTTP APIと同じスキーマと課金体系でFiddl.artのツールを利用できるようにするものです。通信にはSSEとJSON-RPCを使用し、メリットがある箇所ではストリーミングにも対応しています。

Sora v2は、アスペクト比が正しくない開始画像をどのように処理しますか?

アスペクト比がSoraの要件と一致しない場合、システムは通常の画像生成として課金される、控えめなアウトペインティングを生成します。アスペクト比が一致する場合は、単純なリサイズが行われます。どちらのアプローチも、冗長な処理を避けるために決定論的なキャッシュを利用します。

TTSのストリーミング対応は、以前の実装と比べてどのような利点がありますか?

サーバー送信イベント(SSE)経由のストリーミングにより、最初の音声チャンクが届いた時点から再生を開始できるため、遅延が大幅に削減されます。型付けされたイベントシステム(メタデータ、音声、進捗、完了、エラー)は、クライアント側の実装を簡素化し、より明確な終了処理を可能にします。

TikTokのサーバーサイドイベント連携は、アトリビューションをどのように改善しますか?

システムがクライアント側でアトリビューショントークンをキャプチャし、購入や登録などの関連イベントに添付して、TikTokへサーバーサイドイベントとして送信します。これにより、マッチ率が向上し、より正確なコンバージョントラッキングが可能になります。

カスタムAIモデルは、Soraの動画生成で利用できますか?

はい、私たちのカスタムモデル学習システムは、Soraの開始画像準備と完全な互換性があります。クリエイターはForgeシステムを使ってモデルを学習させ、Sora v2およびv2 Proのパイプラインでシームレスに利用できます。