0 / 2500
参照画像がキャラクター・背景などの要素を決めます。サイズ 300px 以上、アスペクト比 2:5〜5:2。
Kling Motion Control — 動きをコピーして、キャラクターはあなたのまま
Kling Motion Control は、モーション転送を実用レベルにした機能です。動いている人物の動画、動かしたいキャラクターの画像、そしてシーンをひとこと。この3つを渡せば、あなたのキャラクターがその動きを表情・カメラワークごと正確に再現した動画が返ってきます。このページでは Kling の2世代を並べて使えて、参照動画は 720p / 1080p で最長30秒。以下では、3つの入力がどう役割分担しているか、どんな動きがきれいに転送できるか、そして結果の大半を決める「構図のルール」を、Kuaishou の公式ガイドと実地テストに基づいて解説します。
3つの入力、3つの別々の仕事
Kuaishou のドキュメントは仕事をきれいに分けています。どの入力が何を支配するかを知ることが、上達のほぼすべてです。
モーション参照 — 動画
骨格を供給します:すべての動き、タイミング、物理、そしてデフォルトではカメラと向きまで。
MP4 か MOV、最大 50MB、3〜30秒、はっきり見える演者1人——映像のきれいさより、構図のクリーンさが勝ちます。
キャラクター参照 — 画像
演者を供給します:顔、体、衣装——誰が動くのか。
JPG か PNG、300px 以上、最大 10MB、アスペクト比 2:5〜5:2——動きに必要な手足がすべて見えていること。
テキストプロンプト — シーン
世界を供給します:背景、光、ムード、スタイル。動きは操りません——それは動画の仕事です。
アクションではなく空気を書きます:「ネオンのステージ、薄い霧、強いリムライト」は効きますが、「もっと速く踊って」は何も起きません。
Kling 2.6 と Kling 3.0、どっちの世代?
両方ここで使えます。公式の説明:3.0 は 2.6 を土台に、顔の安定性と演技の幅を強化したもの。
Kling 3.0 Motion Control
Kuaishou が「シネマティックへの一段昇格」と位置づける世代:シナリオをまたぐ顔の一貫性と、演技向けの高精度キャプチャ。ここでのデフォルト選択です。
クローズアップ、表情で語る演技、顔がショットの主役になるすべての場面に。
Kling 2.6 Motion Control
モーション転送を「使える」レベルにした世代——AI モーションの歴史的弱点だった指の分離と体重移動を、テスターがはっきり認めた実績があります。
SNS 向けの量産やダンス系コンテンツ。最高の顔精度より回転の速さが効く場面に。
実用ルール:体で語るコンテンツは 2.6 で十分、顔で語るコンテンツは 3.0 の出番です。
きれいに転送できる動き・慎重に攻める動き
公式ガイダンスと、繰り返し確認されている実地の結果から。
よく転送できる
- Choreographed dance — the signature use, frame-accurate to the reference
- Martial arts and sports moves with full-body visibility
- Hand gestures and finger detail — distinct fingers since 2.6
- Facial expressions riding on the performance, stronger again in 3.0
- Weight and momentum: stomps, jumps, and landings read physically
- 振り付けのあるダンス——看板ユースケース。参照にフレーム単位で忠実です
- 全身が見える武道・スポーツの動き
- 手のジェスチャーと指のディテール——2.6 以降、指は分離します
- 演技に乗った表情——3.0 でさらに強化
- 重さと勢い:踏み込み、ジャンプ、着地が物理的に読めます
慎重に
- Extremely fast or chaotic movement — official guidance warns output may shorten
- References where limbs are blocked or leave the frame
- Heavily stylized characters far from human proportions
- Multi-person references — isolate one performer first
- Long takes near the 30-second cap with complex action throughout
- 極端に速い・混沌とした動き——出力が短くなる場合があると公式が注意しています
- 手足が隠れたりフレーム外に出る参照
- 人間のプロポーションから大きく外れたキャラクター
- 複数人が映る参照——まず演者1人を切り出しましょう
- 複雑なアクションが続く、30秒上限ぎりぎりの長回し
結果を決める構図のルール
このうちひとつは、Kling 公式ガイドが「インターフェース全体で最も重要な設定」と呼ぶものです。
Match the framing: full body to full body.
If the motion video shows a full-body shot, the character image must be full-body too — half-body against full-body is the most common cause of broken outputs, per the official guide.
Choose who sets the orientation.
Matches Video, the default, lets the reference drive movement, expression, camera, and facing — and supports 3–30 second references. Matches Image keeps your character's original facing and works on 3–10 second references.
Output length follows the reference — usually.
The render matches your motion video's duration, but highly complex or fast action can come back shorter. Plan the edit around the move, not the clock.
構図を合わせる:全身には全身を。
モーション動画が全身ショットなら、キャラクター画像も全身で。半身×全身の組み合わせは、公式ガイド曰く、出力が壊れる最大の原因です。
向きを決めるのはどちらかを選ぶ。
デフォルトの Matches Video は、動き・表情・カメラ・向きのすべてを参照動画に委ね、3〜30秒の参照に対応。Matches Image はキャラクターの元の向きを保ち、3〜10秒の参照で機能します。
出力の長さは参照に従う——たいていは。
レンダリングは参照動画の長さに合わせますが、非常に複雑・高速なアクションでは短くなって返ることがあります。編集計画は時計ではなく、動きを軸に立てましょう。
モーション転送が得意な4つの仕事
各カードで、案件・入力・成果・落とし穴をセットで。
ダンスを、誰にでも踊らせる
案件: 流行りの振り付けを、元のダンサーではなくあなたのキャラクターに踊らせたい。
入力: 振り付けのクリップ+全身のキャラクター画像。構図は揃えて。
返ってくるもの: カメラワークごと、振り付けを拍ごとに再現するあなたのキャラクター。
成立する理由: 振り付けは公式が掲げる看板ケース——タイミングと物理がそのまま渡ります。
注意点: 床技や隠れの多いルーティン。手足が見え続けるテイクを選びましょう。
スクロールを止める動くポスター
案件: 呼吸するキービジュアル:生きた動きを内包したキャラクターポスター。
入力: 短く制御されたモーションクリップ——振り向き、マントの翻り、風になびく髪——とポスターのアート。
返ってくるもの: プレミアや新作発表に使える、ループ対応のアニメーションポスター。
成立する理由: 短く意図的な動きは最も簡単な転送です——ブレ最小、仕上がり最大。
注意点: 文字の多いアート:動きの最中に文字が揺れることがあります——タイトルは後からエディタで合成を。
シネマティックな演技のプリビズ
案件: 本番の撮影前に、演技シーンの動きを決めておきたい。
入力: リファレンスの演技——スマホで撮った自分の芝居で OK——とデザイン済みキャラクター。3.0 を選択。
返ってくるもの: ショット全体で顔の一貫性を保ったまま、キャラクターが演技を届けます。
成立する理由: Kuaishou が 3.0 の用途として名指しするシナリオそのもの:シネマティックな演技と高精度キャプチャ。
注意点: 劇場品質の最終納品——制作級の野心を持ったプリビズとして扱いましょう。
本当に動くブランドマスコット
案件: キャンペーン全体で、マスコットに踊って、手を振って、リアクションしてほしい。
入力: モーションクリップのライブラリ+マスコットの設定画。組み合わせを変えて使い回します。
返ってくるもの: 着ぐるみもスタジオもなしで量産できる、一貫したマスコットの演技シリーズ。
成立する理由: モーションライブラリ×キャラクター画像=再現可能な量産——スケールする方程式です。
注意点: 人間離れしたプロポーションのマスコット——巨大な頭、欠けた手足——はブレやすい。まず5秒でテストを。
モーション転送が崩れるところと、直し方
実際の使用で現れる5つの失敗パターンと、それぞれの効く答え。
Hands grow extra fingers when the image hides them.
直し方: If the motion needs hands, the image must show hands — pockets and crossed arms force the model to hallucinate, and that is where six-finger glitches live.
Very fast action comes back blurred or shortened.
直し方: Slow the reference at capture, split the move into beats, or transfer the cleanest section of the take.
Occluded or cluttered references confuse the skeleton.
直し方: Re-shoot or trim so one performer stays fully visible against a distinct background; a tripod beats handheld.
Characters far from human proportions drift mid-motion.
直し方: Keep designs roughly humanoid, run a five-second test before the full take, and favor stylized-but-bipedal characters.
The scene prompt cannot rescue a weak motion video.
直し方: Atmosphere is the prompt's only job here. Fix problems at the source — a better reference in means a better performance out.
画像で手が隠れていると、指が増えます。
直し方: 動きに手が必要なら、画像にも手が写っていること——ポケットや腕組みはモデルに「手の発明」を強制し、6本指バグはそこで生まれます。
非常に速いアクションは、ブレるか短くなって返ります。
直し方: 撮影時に参照をスローで撮る、動きを拍に分割する、またはテイクの一番きれいな区間だけを転送します。
隠れや物が多い参照は、骨格を混乱させます。
直し方: 演者1人が背景からはっきり分離して映るよう撮り直すかトリミングを。手持ちより三脚です。
人間のプロポーションから遠いキャラクターは、動きの途中でブレます。
直し方: デザインはおおむね人型を保ち、フルテイクの前に5秒テストを回し、スタイライズしても二足歩行のキャラクターを選びましょう。
弱いモーション動画は、シーンプロンプトでは救えません。
直し方: ここでのプロンプトの仕事は空気だけです。問題は源で直しましょう——良い参照を入れれば、良い演技が出てきます。
本当のプロンプトエンジニアリングは入力の準備
このツールでは、品質は文字を打つ前に決まっています。3枚のチェックリストですべてカバーします。
モーション動画チェックリスト
- One performer, fully in frame for the whole take
- 3–30 seconds, MP4 or MOV, under 50MB
- Stable camera — unless you want the camera move transferred too
- Action readable at a glance: if you squint and lose it, so will the model
- 演者は1人、テイク全体でフレーム内に
- 3〜30秒、MP4 か MOV、50MB 未満
- カメラは固定——カメラワークごと転送したい場合を除いて
- 一目で読めるアクション:目を細めて見失うなら、モデルも見失います
キャラクター画像チェックリスト
- Framing matched to the video — full-body for full-body
- Every limb the motion uses, visible: no pockets, no crossed arms
- Sharp, over 300px, aspect ratio between 2:5 and 5:2
- Facing roughly aligned with the video's general orientation
- 構図を動画に合わせる——全身には全身を
- 動きが使うすべての手足が見えていること:ポケットなし、腕組みなし
- シャープで 300px 以上、アスペクト比 2:5〜5:2
- 向きは動画のおおまかな向きに揃える
シーンプロンプトチェックリスト
- Atmosphere only: place, light, weather, style
- Name the look the way a gaffer would: "warm tungsten practicals, light haze"
- No action words — the video owns the choreography
- Keep wording identical when running multiple characters through one motion
- 空気だけ:場所、光、天気、スタイル
- 照明スタッフのように光を名指しする:「暖色のタングステン、薄い霧」
- アクションの言葉は書かない——振り付けは動画のものです
- 複数のキャラクターに同じ動きを通すときは、言い回しを固定します
Motion Control か、画像から動画か、モーションキャプチャか
キャラクターを動かす3つの方法——それぞれに主戦場があります。
Motion Control — このページ
動きがすでに動画として存在していて、正確にコピーしたいとき:ダンス、演技、振り付け、ジェスチャー。
画像から動画
静止画からそれらしい動きをモデルに発明してほしいとき——映像からのコピーではなく、プロンプトで描写する、ゆるやかで雰囲気のある動き。
モーションキャプチャのパイプライン
ゲームエンジンや VFX 用のフレーム精度の骨格データが要るとき。極端なスタイライズや隠れにも対応する伝統的なリグは、そこではまだコストに見合います。
このページでのモーション転送の手順
アップロード2つとシーンの一文——ツールはこのページ上部にあります。
動きをアップロード
3〜30秒の MP4 か MOV を投入——演者1人が見えていて、構図が安定していて、50MB 未満のもの。
演者を追加
動画に構図を合わせ、必要な手足がすべて見えるキャラクター画像をアップロード。世代と向きモードを選択します。
シーンを置いて実行
空気を一文——場所、光、ムード——そして 720p か 1080p で生成し、手と顔を原寸で確認します。
Kling Motion Control:現場の FAQ
出力品質を左右する準備の質問に、公式ドキュメントとテスト済みの結果から答えます。
キャラクターを働かせ続ける
新しい映像を生成する、既存のショットを書き換える、声を与える。
動きはもう撮ってある——演者を替えよう
動きをアップロードして、キャラクターを追加して、舞台をひとこと。Kling Motion Control が、ダンスもジェスチャーも表情もそのままに、あなたのキャストで演技を返します——最大 1080p で。