2026年5月17日時点で、Wan 2.7には画像から動画を作る公式APIルートがあります。ただし最初に決めるべきなのは、どんなプロンプトを書くかではありません。その生成を、Alibaba Cloud Model Studioの公式APIで実行するのか、プロバイダーのAPIラッパーで試すのか、ノーコードの作成ツールで手動確認するのかを先に分ける必要があります。ルートが変わると、アカウント、課金、アップロード、失敗時の扱い、結果URL、サポートの責任者が変わります。
| ルート | 最初に使うべき場面 | アップロード前に見ること |
|---|---|---|
| 公式Model Studio API | プロダクト組み込み、再現可能な検証、公式契約を重視する処理 | 地域、API Key、モデルID、mediaロール、秒数、解像度、課金ルール |
| プロバイダーAPI | 早く試したい、統合APIを使いたい、実装負荷を下げたい | 価格、無料枠、失敗時課金、キュー、ファイル保存、出力URLの保持期間 |
| ノーコード作成ツール | デザイン確認、手動プレビュー、非エンジニアの試作 | 素材利用権、クレジット、透かし、書き出し形式、商用利用、アカウント制限 |
プロバイダーのページにある価格、4K、無料クレジット、失敗時非課金、優先キュー、アップロードポリシーを、Wan 2.7の公式ルールとして扱ってはいけません。公式APIの軸はwan2.7-i2vです。プロバイダーやクリエイターツールの説明は、その入口が約束している条件として別に確認します。
ルートを決めたら、次は入力モードです。1枚の画像から始めるならfirst-frame、終点を制御したいならfirst-and-last-frame、既存動画を続けたいならfirst_clip、音声やリズムを使うならdriving_audioを検討します。プロンプトは、ルートと入力アセットを決めた後に効く調整層です。
まずルートを選び、設定はその後に見る
同じ「Wan 2.7 画像から動画」でも、公式APIとプロバイダーAPIでは失敗時に調べる場所が違います。公式Model Studioでは、モデルID、地域、非同期タスクの状態、media入力、秒数、解像度、アカウント課金を確認します。プロバイダー経由では、残高、キュー、アップロードの保存場所、失敗ジョブの扱い、サポート窓口、結果URLの有効期限が先に問題になります。
日本語圏の検索では、公式ドキュメント、WaveSpeedのようなプロバイダー、ZennやComfyUI系の実装メモ、海外APIラッパーが同じ画面に並びやすいです。どれも参考にはなりますが、同じ種類の情報ではありません。公式ドキュメントは「モデル所有者が何をサポートするか」を示します。プロバイダーは「その入口でどう使えるか」を示します。ComfyUIやツール記事は「特定の実行環境でどう触るか」を示します。
顧客向けの生成、社内ワークフロー、自動処理、CMSへの取り込み、料金説明が必要な用途では、まず公式APIを基準にしてください。タスクID、地域、モデルID、入力URL、パラメータ、結果ファイルをログとして残せるため、後から原因を説明できます。1枚の画像が動くかだけを早く見たいなら、プロバイダーのplaygroundやAPIラッパーは便利です。ただしその便利さは、価格や保存、失敗時の扱いをプロバイダーに預けることとセットです。
ノーコードツールは、デザイナーや編集者が方向性を見る用途に向きます。アップロードして動きの案を比較し、よさそうな表現だけをAPI検証へ進める使い方なら価値があります。一方で、未公開商品、人物写真、顧客素材、権利が複雑な画像を入れる場合は、アップロード後の保存、学習利用、書き出し権限、商用条件を先に見ないと危険です。
安定した順番は、ルートの責任範囲、入力モード、プロンプト、再実行です。最初から長いプロンプトを書くより、誰がファイルと課金を持つのかを確認する方が、失敗時の回復が速くなります。
公式wan2.7-i2vで確認すべきこと
公式契約を見たい場合は、wan2.7-i2vを起点にします。現在のAlibaba Cloud Model Studioドキュメントでは、Wan 2.7の画像から動画APIルートとしてこのモデルIDが示されています。古いWan I2Vの例をそのままコピーすると、モデルID、入力構造、対応範囲がずれる可能性があります。

Wan 2.7のI2Vでは、1枚の開始画像から動画を作るfirst-frame生成、開始画像と終了画像を与えるfirst-and-last-frame生成、既存の動画を続けるvideo continuationが重要です。これは単なるプロンプトの書き分けではなく、入力アセットの契約そのものが違います。
wan2.7-i2vのリクエストでは、単一の画像URLではなく、media配列でアセットの役割を渡します。代表的なロールは次の通りです。
mediaロール | 使う場面 | 注意点 |
|---|---|---|
first_frame | 1枚の画像を最初のフレームにする | 被写体を大きく、輪郭を明確にする |
last_frame | 終了状態を制御したい | 開始画像と終了画像の光、構図、被写体を揃える |
driving_audio | 音声、音楽、リズムを動きに反映したい | 音声が短く明瞭で、映像上の対象と合っている必要がある |
first_clip | 既存クリップの続きを作りたい | 比率、スタイル、動きの方向を保つ |
公式ルートでは、入力画像はURLでアクセスでき、現在のAPIリファレンスが示すフォーマット、寸法、縦横比、ファイルサイズの範囲に入っている必要があります。2.7 I2Vでは、720P/1080P系の出力と2秒から15秒の範囲が示されています。ここでの数値は公式Model Studioルートの事実であり、すべてのプロバイダーやツールに自動適用されるわけではありません。
地域も実装上の事実です。国際向けと中国本土向けではendpointやアカウント地域が違います。API Key、endpoint、アカウント地域が合っていないと、モデル品質以前にリクエストが失敗します。画像URLが外部から読めない場合も同じです。
課金についても境界を守ります。現在の公式ガイドでは、Wan 2.7 I2Vは成功した出力動画の秒数に基づいて課金され、モデル呼び出しや処理が失敗した場合は課金されないという扱いです。ただし固定の秒単価は、最終公開前に公式価格ページで再確認すべき高変動情報です。プロバイダーのクレジット単価を公式価格として書かないでください。
入力モードはプロンプトより先に決める
最初の動画が崩れる原因は、プロンプトの語彙不足より入力モードの選択ミスであることが多いです。1枚の画像だけで正確な終点を要求したり、音声なしで口の動きを期待したり、既存動画の続きを普通の静止画タスクとして送ったりすると、モデルは制御できない要求を文章で補うことになります。

1枚の画像で軽く試すならfirst_frameから始めます。商品写真、風景、人物ポスター、コンセプトアートなどで、軽いカメラ移動、光の変化、水や雲の動き、商品回転、小さなジェスチャーを試す用途に向きます。終点の自由度は高くなるため、最初から細かな最終ポーズを要求しない方が安定します。
終点を決めたい場合はlast_frameを使います。商品が閉じた状態から開く、キャラクターが特定の姿勢になる、物体がA地点からB地点へ動く、昼の構図から夜の構図へ移る、というような仕事では終点画像が役に立ちます。開始画像と終了画像の光、カメラ角度、被写体の同一性が離れすぎると、補間ではなく場面転換を解かせることになります。
first_clipは、既存動画の続きを作るための入力です。単なる高級なfirst-frameではありません。元クリップの圧縮が強い、被写体が端に寄っている、カメラが不安定、アスペクト比が目的と違う場合、続きもその不安定さを引き継ぎます。
driving_audioは、リズム、口の動き、音楽のアクセントが重要なときに加えます。音声は、曖昧な画像を救うものではありません。まず被写体、構図、動きの方向を明確にし、そのうえで短く明瞭な音声を与える方が安定します。
最初のプロンプトは、雰囲気だけでなく作業指示として書きます。主役、動くもの、動かないもの、カメラ、速度、避けたい破綻を明示します。
textAnimate the source image into a 5-second realistic video. Subject: the product stays sharp and centered. Motion: soft light moves across the surface; no new object appears. Camera: slow push-in, stable, no shake. Avoid: warped logo, extra text, fast transformation.
この形は万能ではありません。役割は、最初の失敗を減らすことです。不要な物体の出現、カメラの揺れ、ロゴの歪み、被写体の変形、動きの過剰さを抑えてから、スタイルやテンポを少しずつ調整します。
API実装は非同期ジョブとして組む
動画生成を、すぐファイルが返る通常のHTTP呼び出しとして扱うと、運用で詰まります。実装では、タスクを投入し、task idを保存し、状態をpollingし、成功したら結果URLを受け取り、自分のストレージへ保存する流れにします。
公式APIでは非同期呼び出しの前提を守ります。endpoint、地域、API Keyは現在のModel Studioドキュメントとコンソールに合わせます。国際向けアカウントと中国本土向けアカウントを同じ例の中で曖昧に混ぜると、後で地域不一致の障害を生みます。
最小のpayloadは次のような形です。
jsconst payload = { model: "wan2.7-i2v", input: { prompt: "Slow camera push, soft cloud movement, stable subject.", media: [ { type: "first_frame", url: "https://example.com/source-image.png" } ] }, parameters: { resolution: "1080P", duration: 5 } };
本番では、プロンプトだけを保存しても足りません。少なくとも、route owner、model ID、mediaロール、source asset URLまたはstorage key、region、endpoint、duration、resolution、task id、最終status、結果URL、自社保存先を記録します。プロバイダー経由なら、provider job id、キュー状態、課金単位、失敗時ルール、出力URLの保持期間も必要です。
| ログ項目 | なぜ必要か |
|---|---|
| route owner | 公式API、ラッパー、ツールの挙動を分ける |
| model ID | wan2.7-i2vか古いWanルートかを判定する |
| media roles | first_frame、last_frame、driving_audio、first_clipを説明できる |
| region and endpoint | API Keyとendpointの不一致を見つける |
| duration and resolution | 品質、課金、出力比率を説明できる |
| task id and status | retry、問い合わせ、監査に使える |
| output storage | 一時URLの期限切れを防ぐ |
失敗したときに最初に直すのはプロンプトではありません。認証、地域、URLアクセス、ファイルサイズ、ロール名、duration、resolution、キュー、プロバイダーポリシーを先に分けます。リクエストが正しいと分かってから、初めてプロンプトの改善に入ります。
プロバイダーとノーコードは別ルートとして監査する
プロバイダーは悪い選択肢ではありません。最初の動画を早く見る、統合APIで複数モデルを試す、支払いを簡単にする、SDKやサンプルを使う、という意味ではとても便利です。問題は、プロバイダーのページがモデル能力、独自価格、キュー、クレジット、失敗時ルール、アップロード条件を同時に書きがちなことです。
使う前に、次の問いを1つずつ確認します。
| 質問 | 理由 |
|---|---|
| どのモデルIDとバージョンを使っているか | 古いWanや別backendを同じ名前で使うリスクを避ける |
| 価格と単位は誰が決めているか | プロバイダーcreditsは公式価格ではない |
| 失敗ジョブは課金されるか | refundや再実行の扱いはルートごとに違う |
| アップロード素材はどこに保存されるか | 顧客画像、人物写真、未公開素材で重要 |
| 出力URLはどれくらい保持されるか | CMSやプレビューが後から壊れる可能性がある |
| watermarkや圧縮はあるか | 下書きにはよくても商用納品に不向きな場合がある |
ノーコードツールも同じ考え方です。デザイン案の確認、チーム内レビュー、手動の表現探索には向いています。しかし自動生成、商用素材、顧客素材、権利が厳しい画像では、素材保存、利用範囲、出力権限、アカウント制限を事前に確認しないといけません。
プロバイダーを「事実の出典」ではなく「実行ルート」として扱うと、判断が安定します。便利な入口として使ってもよいが、公式APIが何をサポートするか、どの入力ロールがあるか、失敗時にどう課金されるかは公式ドキュメントで確認します。
画像とプロンプトのアップロード前チェック
入力画像は、単なる素材ではなく動画の最初の契約です。ぼやけた画像、強く圧縮された画像、被写体が小さい画像、細かい文字や透かしがある画像、背景が混みすぎている画像では、モデルが動きを作る前に安定性を補わなければなりません。

最初のテストでは、被写体が大きく、輪郭が明確で、動く余白があり、光が安定し、保持したい細部が過度に小さくない画像を選びます。人物、商品、ロゴ、建築物では、見た目の派手さより同一性の維持を優先します。
プロンプトは、主語、動作、カメラ、速度、スタイル、禁止事項に分けます。5秒の動画では、1つのカメラ移動と1つの主要な動きで十分です。複数人物の複雑な演技、大きなシーン変化、商品変形、背景入れ替えを同時に求めると、最初の結果は不安定になりやすいです。
再実行のたびに、ルート、入力モード、画像サイズ、プロンプト版、秒数、解像度、task id、provider job id、結果評価を残します。この記録がないと、良くなった理由が、画像の改善、モード変更、プロンプト変更、プロバイダー変更、モデルのばらつきのどれか分かりません。
失敗は枝ごとに切り分ける
リクエストが処理前に失敗する場合は、API Key、endpoint、地域、model ID、画像URL、フォーマット、ファイルサイズ、縦横比、mediaロール、duration、resolutionを確認します。プロバイダー経由なら、残高、アップロード制限、キュー、proxy error、プロバイダー側のエラー変換も見ます。
ジョブは成功するのに動きが弱い場合は、プロンプトを長くするより、シーンを単純にします。1つの被写体、1つのカメラ移動、短い秒数から始めます。終点を正確にしたいなら、長文で説明するのではなくfirst-and-last-frameに切り替えます。
被写体が崩れる場合は、動きを控えめにし、より清潔なsource imageを使います。顔、手、ロゴ、細かい文字は、水、雲、光、背景より壊れやすいです。商用用途では、もっとも派手な動画ではなく、被写体を保てる動画を採用します。
プロバイダー結果と公式ルートの結果が違う場合、すぐにモデル差と決めつけないでください。preset、duration default、upload compression、retry、post-processingが違う可能性があります。比較するなら、route、model ID、mode、duration、resolution、source image、promptを揃えます。
動画URLが後から開けない場合は、生成ではなく保持期間の問題かもしれません。成功したらすぐに自社ストレージへコピーします。最終的にユーザーへ表示するファイルの場所を自分で持つまで、生成タスクは完了していません。
GeminiやKlingとどう分けるか
Wan 2.7は、Alibaba Cloud、wan2.7-i2v、またはWan系プロバイダーを使いたい場合に自然な選択です。Google系の動画生成ルートを評価しているなら、Gemini image-to-video tutorialの方が近い比較対象です。Kuaishou/Kling系を見たい場合は、ローカル記事がないため英語のKling AI image-to-video API guideを参照します。
比較は同じ画像、同じ秒数、近いアスペクト比、同じ動きの目的、同じ失敗記録で行います。スクリーンショットやデモだけで「どれが最強か」を決めると、ルートの違い、プロンプト、プリセット、後処理が混ざります。
Wan 2.7を残すべきなのは、公式契約、地域、価格、出力スタイル、運用ログが今のタスクに合っている場合です。別ルートへ移るべきなのは、別の公式契約、より分かりやすい支払い、良い地域アクセス、または同一画像で明確に良い結果がある場合です。
公開前の最小チェック
記事やプロダクトでWan 2.7 I2Vを案内する前に、1回は再現できるテストを残します。きれいなsource imageを1枚選び、ルート、mode、prompt、duration、resolution、task id、output URL、保存先、実際の課金単位を記録します。プロバイダーなら、provider job id、残高単位、failed-job rule、URL保持期間も残します。
チーム内では、公式API、プロバイダー、ノーコードを別のSOPに分けると運用しやすくなります。公式APIは再現性とログ、プロバイダーは速度とgatewayの便利さ、ノーコードは手動プレビューです。これを混ぜると、サポート、開発、コンテンツ担当が同じ「Wan 2.7」と言いながら別のルールを見てしまいます。
最後に、変わりやすい情報を公開前に確認します。model ID、入力ロール、秒数、解像度、ファイル制限、地域、endpoint、価格、無料枠、4K、失敗時課金、保存期間は、読者の支払い、素材アップロード、プロダクト実装に直結します。記憶で固定しないでください。
よくある質問
wan2.7-i2vは公式の画像から動画APIですか?
はい。現在のAlibaba Cloud Model Studioドキュメントでは、wan2.7-i2vがWan 2.7の画像から動画APIのモデルIDとして示されています。プロバイダーの入口は便利ですが、公式モデルIDの根拠にはなりません。
Wan 2.7の画像から動画は無料ですか?
無料と断定しないでください。公式ルートは成功した出力動画の秒数に基づく課金として扱われます。プロバイダーはtrial creditsやsubscriptionを持つ場合があります。ノーコードツールはexportやcreditsのルールが別です。
公式APIで4K動画を作れますか?
確認済みの公式2.7 I2Vドキュメントでは、720P/1080P系の出力と2秒から15秒の範囲が中心です。4Kをうたうページがあっても、公式APIの現在の仕様で確認できるまではルート固有の主張として扱います。
最初はどの入力モードを使うべきですか?
1枚の画像だけならfirst_frameです。終点を制御したいならlast_frameを加えます。既存動画を続けたいならfirst_clipです。音声や音楽が動きのタイミングを決める場合だけdriving_audioを検討します。
プロバイダーAPIを使っても大丈夫ですか?
低リスクのテストや早い検証には便利です。顧客素材、人物、未公開商品、商用利用では、保存、データ利用、出力権利、失敗時課金、サポート、URL保持期間を先に確認してください。
デモより結果が悪い原因は何ですか?
source imageが弱い、動きが多すぎる、入力モードが違う、カメラ指示が曖昧、ファイルが圧縮されている、プロバイダーのpresetが違う、などが多いです。短い秒数と単純な動きで再テストしてください。
Wan 2.7とKlingはどちらを選ぶべきですか?
Alibaba Cloud、wan2.7-i2v、Wan系プロバイダーが必要ならWan 2.7です。Klingのモデルファミリーや既存連携が重要ならKlingです。公平な比較には同じsource image、秒数、アスペクト比、prompt、評価基準が必要です。
