0 / 2500
L'image de référence définit les personnages, le décor et les autres éléments. Taille ≥ 300 px, ratio 2:5 à 5:2.
Kling Motion Control — copiez le mouvement, gardez votre personnage
Kling Motion Control, c'est le transfert de mouvement rendu praticable : donnez-lui une vidéo de quelqu'un qui bouge, une image de qui doit bouger, et une ligne sur la scène — il vous rend votre personnage exécutant ce mouvement exact, expressions et caméra comprises. Cette page fait tourner les deux générations de Kling côte à côte, avec des vidéos de référence jusqu'à trente secondes en 720p ou 1080p. Ci-dessous : comment les trois entrées se répartissent le travail, quels mouvements se transfèrent proprement, et la règle de cadrage qui décide de la plupart des résultats — d'après les guides officiels de Kuaishou et les tests de terrain.
Trois entrées, trois métiers différents
La documentation de Kuaishou répartit le travail nettement. Savoir quelle entrée contrôle quoi, c'est l'essentiel du métier.
La référence de mouvement — vidéo
Fournit le squelette : chaque mouvement, son timing, la physique, et par défaut la caméra et l'orientation aussi.
MP4 ou MOV jusqu'à 50 Mo, 3 à 30 secondes, un seul interprète bien visible — un cadrage propre vaut mieux qu'une grosse production.
La référence de personnage — image
Fournit l'interprète : visage, corps, tenue — qui exécute le mouvement.
JPG ou PNG au-delà de 300 px, jusqu'à 10 Mo, ratio entre 2:5 et 5:2 — avec chaque membre dont le mouvement aura besoin réellement visible.
Le prompt texte — scène
Fournit le monde : décor, lumière, ambiance, style. Il ne pilote pas le mouvement — la vidéo s'en charge déjà.
Décrivez l'atmosphère, pas l'action : « scène néon, brume, contre-jour dur » fonctionne ; « danse plus vite » ne fait rien.
Kling 2.6 ou Kling 3.0 : quelle génération ?
Les deux tournent ici. La ligne officielle : le 3.0 prolonge le 2.6 avec des visages plus solides et un registre de jeu plus large.
Kling 3.0 Motion Control
Kuaishou le positionne comme le cran cinématographique au-dessus : une cohérence faciale renforcée selon les scénarios et une capture haute précision pour le travail de jeu d'acteur. La sélection par défaut ici.
Les gros plans, le jeu mené par l'expression, et tout plan où le visage porte l'image.
Kling 2.6 Motion Control
La génération qui a rendu le transfert de mouvement fiable — les testeurs lui reconnaissent des doigts distincts et de vrais transferts de poids, deux faiblesses historiques du mouvement IA.
La production sociale en volume et les contenus dansés, où la cadence compte plus que la fidélité faciale maximale.
Règle de travail : le contenu mené par le corps tourne bien sur le 2.6 ; le contenu mené par le visage mérite le 3.0.
Ce qui se transfère proprement — et ce qu'il faut aborder doucement
Compilé à partir des consignes officielles et des résultats récurrents de terrain.
Se transfère bien
- Choreographed dance — the signature use, frame-accurate to the reference
- Martial arts and sports moves with full-body visibility
- Hand gestures and finger detail — distinct fingers since 2.6
- Facial expressions riding on the performance, stronger again in 3.0
- Weight and momentum: stomps, jumps, and landings read physically
- La danse chorégraphiée — l'usage signature, fidèle à la référence image par image
- Arts martiaux et gestes sportifs avec le corps entier visible
- Gestes des mains et détail des doigts — des doigts distincts depuis le 2.6
- Les expressions du visage portées par le jeu, encore renforcées dans le 3.0
- Poids et élan : les appuis, sauts et réceptions sonnent physiquement justes
À pousser prudemment
- Extremely fast or chaotic movement — official guidance warns output may shorten
- References where limbs are blocked or leave the frame
- Heavily stylized characters far from human proportions
- Multi-person references — isolate one performer first
- Long takes near the 30-second cap with complex action throughout
- Les mouvements très rapides ou chaotiques — la consigne officielle prévient que la sortie peut raccourcir
- Les références où des membres sont masqués ou sortent du cadre
- Les personnages très stylisés, loin des proportions humaines
- Les références à plusieurs personnes — isolez d'abord un interprète
- Les prises longues près du plafond de 30 secondes avec de l'action complexe en continu
Les règles de cadrage qui décident du résultat
L'une d'elles est qualifiée de « réglage le plus important de toute l'interface » par le guide de Kling lui-même.
Match the framing: full body to full body.
If the motion video shows a full-body shot, the character image must be full-body too — half-body against full-body is the most common cause of broken outputs, per the official guide.
Choose who sets the orientation.
Matches Video, the default, lets the reference drive movement, expression, camera, and facing — and supports 3–30 second references. Matches Image keeps your character's original facing and works on 3–10 second references.
Output length follows the reference — usually.
The render matches your motion video's duration, but highly complex or fast action can come back shorter. Plan the edit around the move, not the clock.
Accordez les cadrages : plein pied avec plein pied.
Si la vidéo de mouvement montre un plan en pied, l'image du personnage doit l'être aussi — le mi-corps contre plein pied est la première cause de sorties cassées, selon le guide officiel.
Choisissez qui fixe l'orientation.
Matches Video, le mode par défaut, laisse la référence piloter mouvement, expression, caméra et orientation — et accepte des références de 3 à 30 secondes. Matches Image conserve l'orientation d'origine de votre personnage et fonctionne sur des références de 3 à 10 secondes.
La durée de sortie suit la référence — en général.
Le rendu cale sa durée sur votre vidéo de mouvement, mais une action très complexe ou rapide peut revenir plus courte. Planifiez le montage autour du geste, pas du chrono.
Quatre travaux que le transfert de mouvement fait bien
Chaque carte associe le brief aux entrées, au gain et au piège.
La danse, recréée sur n'importe qui
Le brief: Une chorégraphie tendance qui doit être dansée par votre personnage, pas par le danseur d'origine.
Les entrées: Le clip de la chorégraphie + une image du personnage en pied, cadrages accordés.
Ce qui revient: Votre personnage exécutant la chorégraphie temps par temps, mouvements de caméra compris.
Pourquoi ça marche: La chorégraphie est le cas signature documenté — le timing et la physique se transmettent intacts.
Attention à: Les passages au sol et les fortes occlusions ; choisissez une prise où les membres restent visibles.
Des affiches animées qui arrêtent le scroll
Le brief: Un visuel clé qui respire : une affiche de personnage avec du mouvement vivant à l'intérieur.
Les entrées: Un court clip de mouvement maîtrisé — une rotation, une cape qui se soulève, des cheveux au vent — plus votre visuel d'affiche.
Ce qui revient: Une affiche animée prête à boucler pour les avant-premières, les sorties et les annonces.
Pourquoi ça marche: Un mouvement bref et délibéré est le transfert le plus facile qui soit — dérive minimale, poli maximal.
Attention à: Les visuels chargés en texte : la typo peut onduler pendant le mouvement — compositez le titre après coup dans un éditeur.
Préviz de jeu d'acteur cinématographique
Le brief: Poser la mise en place d'une scène jouée avant d'engager un tournage.
Les entrées: Une performance de référence — la vôtre, filmée au téléphone — plus le personnage designé, 3.0 sélectionné.
Ce qui revient: Le personnage livrant la performance avec une cohérence faciale tenue sur tout le plan.
Pourquoi ça marche: Exactement le scénario que Kuaishou cite pour le 3.0 : jeu cinématographique et capture haute précision.
Attention à: La livraison finale en salle — traitez-la comme une préviz aux ambitions de production.
Une mascotte de marque qui bouge vraiment
Le brief: La mascotte doit danser, saluer et réagir sur toute une campagne.
Les entrées: Une bibliothèque de clips de mouvement + la planche de la mascotte, réutilisées combinaison par combinaison.
Ce qui revient: Une série de performances de mascotte cohérente, produite sans costume ni studio.
Pourquoi ça marche: Une bibliothèque de mouvements multipliée par une image de personnage égale une production répétable — le schéma qui passe à l'échelle.
Attention à: Les mascottes aux proportions non humaines — têtes géantes, membres manquants — dérivent davantage ; testez d'abord avec cinq secondes.
Là où le transfert de mouvement casse — et les corrections
Cinq défaillances qui apparaissent en usage réel, chacune avec la réponse qui marche.
Hands grow extra fingers when the image hides them.
Correction: If the motion needs hands, the image must show hands — pockets and crossed arms force the model to hallucinate, and that is where six-finger glitches live.
Very fast action comes back blurred or shortened.
Correction: Slow the reference at capture, split the move into beats, or transfer the cleanest section of the take.
Occluded or cluttered references confuse the skeleton.
Correction: Re-shoot or trim so one performer stays fully visible against a distinct background; a tripod beats handheld.
Characters far from human proportions drift mid-motion.
Correction: Keep designs roughly humanoid, run a five-second test before the full take, and favor stylized-but-bipedal characters.
The scene prompt cannot rescue a weak motion video.
Correction: Atmosphere is the prompt's only job here. Fix problems at the source — a better reference in means a better performance out.
Les mains gagnent des doigts en trop quand l'image les cache.
Correction: Si le mouvement a besoin des mains, l'image doit montrer les mains — poches et bras croisés forcent le modèle à halluciner, et c'est là que vivent les ratés à six doigts.
Les actions très rapides reviennent floues ou raccourcies.
Correction: Ralentissez la référence à la prise, découpez le geste en temps, ou ne transférez que la section la plus propre.
Les références masquées ou encombrées embrouillent le squelette.
Correction: Retournez ou coupez pour qu'un seul interprète reste entièrement visible sur un fond qui se détache ; un trépied bat le filmé à la main.
Les personnages loin des proportions humaines dérivent en plein mouvement.
Correction: Restez à peu près humanoïde, lancez un test de cinq secondes avant la prise complète, et privilégiez les personnages stylisés mais bipèdes.
Le prompt de scène ne peut pas sauver une vidéo de mouvement faible.
Correction: L'atmosphère est le seul métier du prompt ici. Corrigez les problèmes à la source — une meilleure référence en entrée, c'est une meilleure performance en sortie.
Préparer les entrées, c'est ça le vrai prompt engineering
Sur cet outil, la qualité se joue avant le premier mot tapé. Trois checklists couvrent tout.
Checklist vidéo de mouvement
- One performer, fully in frame for the whole take
- 3–30 seconds, MP4 or MOV, under 50MB
- Stable camera — unless you want the camera move transferred too
- Action readable at a glance: if you squint and lose it, so will the model
- Un seul interprète, entièrement dans le cadre du début à la fin
- 3 à 30 secondes, MP4 ou MOV, moins de 50 Mo
- Caméra stable — sauf si vous voulez transférer le mouvement de caméra aussi
- Une action lisible d'un coup d'œil : si vous la perdez en plissant les yeux, le modèle aussi
Checklist image du personnage
- Framing matched to the video — full-body for full-body
- Every limb the motion uses, visible: no pockets, no crossed arms
- Sharp, over 300px, aspect ratio between 2:5 and 5:2
- Facing roughly aligned with the video's general orientation
- Cadrage accordé à la vidéo — plein pied avec plein pied
- Chaque membre utilisé par le mouvement, visible : pas de poches, pas de bras croisés
- Nette, plus de 300 px, ratio entre 2:5 et 5:2
- Orientation à peu près alignée sur celle de la vidéo
Checklist prompt de scène
- Atmosphere only: place, light, weather, style
- Name the look the way a gaffer would: "warm tungsten practicals, light haze"
- No action words — the video owns the choreography
- Keep wording identical when running multiple characters through one motion
- Atmosphère uniquement : lieu, lumière, météo, style
- Nommez la lumière comme un chef électro : « tungstène chaud, légère brume »
- Aucun mot d'action — la vidéo possède la chorégraphie
- Gardez la même formulation quand plusieurs personnages passent par un même mouvement
Motion Control, image vers vidéo, ou pipeline de mocap ?
Trois façons de faire bouger un personnage — chacune possède son brief.
Motion Control — cette page
Le mouvement existe déjà en vidéo et doit être copié précisément : danse, jeu d'acteur, chorégraphie, geste.
Image vers vidéo
Vous voulez que le modèle invente un mouvement plausible depuis une image fixe — ambiant, libre, décrit dans un prompt plutôt que copié sur des images.
Un pipeline de capture de mouvement
Des données squelettiques exactes à l'image près pour moteurs de jeu ou VFX, avec stylisation extrême et occlusions — le rig traditionnel y gagne encore son coût.
Comment fonctionne le transfert de mouvement ici
Deux imports et une ligne de direction de scène — l'outil est en haut de cette page.
Importez le mouvement
Déposez un MP4 ou MOV de 3 à 30 secondes du mouvement — un interprète visible, cadrage stable, moins de 50 Mo.
Ajoutez l'interprète
Importez l'image du personnage avec un cadrage accordé à la vidéo et chaque membre nécessaire en vue ; choisissez la génération et le mode d'orientation.
Posez la scène et lancez
Une ligne d'atmosphère — lieu, lumière, ambiance — puis générez en 720p ou 1080p et inspectez mains et visage en taille réelle.
Kling Motion Control : la FAQ de terrain
Les questions de préparation qui décident de la qualité de sortie — répondues depuis les docs officielles et les résultats testés.
Gardez le personnage au travail
Générez de nouvelles images, réécrivez des plans existants, ou donnez-lui une voix.
Le mouvement est déjà filmé — changez l'interprète
Importez le mouvement, ajoutez votre personnage, décrivez la scène. Kling Motion Control vous rend la performance avec votre casting, jusqu'en 1080p — danse, geste et expression intacts.