0 / 2500
A imagem de referência define personagem, fundo e demais elementos. Mínimo de 300 px, proporção entre 2:5 e 5:2.
Kling Motion Control — copie o movimento, mantenha o personagem
O Kling Motion Control é a transferência de movimento em nível utilizável. Entregue três coisas — um vídeo de alguém se movendo, a imagem do personagem que deve se mover e uma linha descrevendo a cena — e receba um vídeo do seu personagem reproduzindo aquele movimento com precisão, expressão facial e trabalho de câmera incluídos. Nesta página, as duas gerações do Kling ficam lado a lado, e o vídeo de referência vai até 30 segundos em 720p ou 1080p. Abaixo: como as três entradas dividem o trabalho, quais movimentos transferem limpo e a regra de enquadramento que decide a maior parte do resultado — com base no guia oficial da Kuaishou e em testes práticos.
Três entradas, três trabalhos separados
A documentação da Kuaishou divide as funções com clareza. Saber qual entrada domina o quê é quase toda a habilidade.
Referência de movimento — o vídeo
Fornece o esqueleto: todo movimento, tempo, física e, por padrão, até a câmera e a orientação.
MP4 ou MOV, até 50 MB, 3 a 30 segundos, uma pessoa claramente visível. Enquadramento limpo vale mais que produção cara.
Referência de personagem — a imagem
Fornece o intérprete: rosto, corpo, figurino. Quem se move.
JPG ou PNG, mínimo de 300 px, até 10 MB, proporção entre 2:5 e 5:2 — com todos os membros que o movimento usa à mostra.
Prompt de texto — a cena
Fornece o mundo: fundo, luz, clima, estilo. Não controla o movimento — isso é trabalho do vídeo.
Escreva atmosfera, não ação: "palco neon, névoa fina, contraluz forte" funciona; "dance mais rápido" não faz nada.
Kling 2.6 ou 3.0: qual geração?
As duas rodam aqui. Na definição oficial, o 3.0 constrói sobre o 2.6 com mais estabilidade facial e alcance de atuação.
Kling 3.0 Motion Control
A geração que a Kuaishou posiciona como o salto para o cinematográfico: consistência facial entre cenários e captura de alta precisão para atuação. É o padrão desta página.
Closes, atuação que fala pela expressão e toda cena em que o rosto é o protagonista do plano.
Kling 2.6 Motion Control
A geração que tornou a transferência de movimento utilizável — com separação de dedos e transferência de peso reconhecidas pelos testadores, as fraquezas históricas do movimento por IA.
Produção em volume para redes e conteúdo de dança. Onde a velocidade de retorno vale mais que o rosto perfeito.
Regra prática: conteúdo que fala com o corpo se resolve no 2.6; conteúdo que fala com o rosto pede o 3.0.
O que transfere limpo — e o que exige cautela
Da orientação oficial e dos resultados de campo confirmados repetidamente.
Transfere bem
- Choreographed dance — the signature use, frame-accurate to the reference
- Martial arts and sports moves with full-body visibility
- Hand gestures and finger detail — distinct fingers since 2.6
- Facial expressions riding on the performance, stronger again in 3.0
- Weight and momentum: stomps, jumps, and landings read physically
- Dança coreografada — o caso de uso vitrine, fiel à referência quadro a quadro
- Artes marciais e movimentos esportivos com o corpo inteiro visível
- Gestos de mão e detalhe de dedos — desde o 2.6, os dedos se separam
- Expressão facial carregada na atuação — reforçada no 3.0
- Peso e impulso: passos firmes, saltos e aterrissagens legíveis fisicamente
Com cautela
- Extremely fast or chaotic movement — official guidance warns output may shorten
- References where limbs are blocked or leave the frame
- Heavily stylized characters far from human proportions
- Multi-person references — isolate one performer first
- Long takes near the 30-second cap with complex action throughout
- Movimento extremamente rápido ou caótico — a saída pode encurtar, segundo o aviso oficial
- Referências com membros ocultos ou saindo do quadro
- Personagens muito fora da proporção humana
- Referência com várias pessoas — isole um intérprete primeiro
- Planos longos perto do teto de 30 s com ação complexa contínua
As regras de enquadramento que decidem o resultado
Uma delas é o que o guia oficial do Kling chama de configuração mais importante da interface inteira.
Match the framing: full body to full body.
If the motion video shows a full-body shot, the character image must be full-body too — half-body against full-body is the most common cause of broken outputs, per the official guide.
Choose who sets the orientation.
Matches Video, the default, lets the reference drive movement, expression, camera, and facing — and supports 3–30 second references. Matches Image keeps your character's original facing and works on 3–10 second references.
Output length follows the reference — usually.
The render matches your motion video's duration, but highly complex or fast action can come back shorter. Plan the edit around the move, not the clock.
Casem os enquadramentos: corpo inteiro com corpo inteiro.
Se o vídeo de movimento é de corpo inteiro, a imagem do personagem também precisa ser. Meio corpo com corpo inteiro é, pelo guia oficial, a causa número um de saída quebrada.
Escolha quem manda na orientação.
O padrão Matches Video entrega tudo — movimento, expressão, câmera e orientação — ao vídeo de referência e aceita 3 a 30 s. Matches Image preserva a orientação original do personagem e funciona com referências de 3 a 10 s.
A duração da saída segue a referência — na maioria das vezes.
A renderização acompanha a duração do vídeo de referência, mas ações muito complexas ou rápidas podem voltar mais curtas. Planeje a edição pelo movimento, não pelo relógio.
4 trabalhos em que a transferência de movimento brilha
Cada cartão traz o caso, as entradas, o resultado e a armadilha.
Fazer qualquer um dançar
Caso: A coreografia do momento, dançada pelo seu personagem em vez do dançarino original.
Entradas: Clipe da coreografia + imagem de corpo inteiro do personagem, com enquadramentos casados.
O que volta: Seu personagem reproduzindo a coreografia batida por batida, com o trabalho de câmera junto.
Por que funciona: Coreografia é o caso vitrine oficial: tempo e física atravessam direto.
Atenção: Rotinas com chão e muita oclusão — prefira takes em que os membros ficam visíveis.
Pôster vivo que para o scroll
Caso: O visual-chave que respira: pôster de personagem com movimento vivo dentro.
Entradas: Clipe de movimento curto e controlado — virada de rosto, capa ao vento, cabelo na brisa — mais a arte do pôster.
O que volta: Pôster animado pronto para loop, para estreias e lançamentos.
Por que funciona: Movimento curto e intencional é a transferência mais fácil: deriva mínima, acabamento máximo.
Atenção: Arte cheia de letras: o texto pode tremer durante o movimento — componha o título depois, no editor.
Previz de atuação cinematográfica
Caso: Marcar o movimento da cena de atuação antes da filmagem de verdade.
Entradas: A atuação de referência — pode ser você no celular — mais o personagem desenhado. Escolha o 3.0.
O que volta: O personagem entrega a atuação com consistência facial pelo plano inteiro.
Por que funciona: É o cenário que a Kuaishou nomeia para o 3.0: atuação cinematográfica e captura de alta precisão.
Atenção: Entrega final em qualidade de cinema — trate como previz com ambição de produção.
Mascote de marca que se move de verdade
Caso: O mascote dançando, acenando e reagindo ao longo da campanha inteira.
Entradas: Biblioteca de clipes de movimento + arte de modelo do mascote, recombinadas à vontade.
O que volta: Série consistente de atuações do mascote, produzida sem fantasia nem estúdio.
Por que funciona: Biblioteca de movimento × imagem de personagem = produção repetível. A equação que escala.
Atenção: Mascotes fora da proporção humana — cabeça gigante, membros faltando — derivam mais. Teste 5 segundos antes.
Onde a transferência quebra — e como consertar
Os 5 padrões de falha do uso real, cada um com a resposta que funciona.
Hands grow extra fingers when the image hides them.
Conserto: If the motion needs hands, the image must show hands — pockets and crossed arms force the model to hallucinate, and that is where six-finger glitches live.
Very fast action comes back blurred or shortened.
Conserto: Slow the reference at capture, split the move into beats, or transfer the cleanest section of the take.
Occluded or cluttered references confuse the skeleton.
Conserto: Re-shoot or trim so one performer stays fully visible against a distinct background; a tripod beats handheld.
Characters far from human proportions drift mid-motion.
Conserto: Keep designs roughly humanoid, run a five-second test before the full take, and favor stylized-but-bipedal characters.
The scene prompt cannot rescue a weak motion video.
Conserto: Atmosphere is the prompt's only job here. Fix problems at the source — a better reference in means a better performance out.
Mãos ocultas na imagem viram dedos a mais.
Conserto: Se o movimento usa as mãos, a imagem precisa mostrá-las. Bolsos e braços cruzados forçam o modelo a inventar mãos — e o bug do sexto dedo nasce aí.
Ação muito rápida volta borrada ou encurtada.
Conserto: Grave a referência em câmera lenta, divida o movimento em batidas ou transfira só o trecho mais limpo da take.
Referências com oclusão e objetos confundem o esqueleto.
Conserto: Regrave ou recorte até uma pessoa bem separada do fundo. Tripé vence mão livre.
Personagens longe da proporção humana derivam no meio do movimento.
Conserto: Mantenha o design aproximadamente humanoide, rode um teste de 5 segundos antes da take completa e prefira personagens bípedes mesmo estilizados.
Vídeo de movimento fraco não se salva com prompt de cena.
Conserto: O prompt aqui só cuida da atmosfera. Conserte na fonte: referência boa entra, atuação boa sai.
O verdadeiro prompt engineering é preparar a entrada
Nesta ferramenta, a qualidade se decide antes de digitar. Três checklists cobrem tudo.
Checklist do vídeo de movimento
- One performer, fully in frame for the whole take
- 3–30 seconds, MP4 or MOV, under 50MB
- Stable camera — unless you want the camera move transferred too
- Action readable at a glance: if you squint and lose it, so will the model
- Uma pessoa, dentro do quadro a take inteira
- 3 a 30 segundos, MP4 ou MOV, menos de 50 MB
- Câmera fixa — a menos que você queira transferir o movimento de câmera junto
- Ação legível de relance: se você aperta os olhos e perde, o modelo também perde
Checklist da imagem do personagem
- Framing matched to the video — full-body for full-body
- Every limb the motion uses, visible: no pockets, no crossed arms
- Sharp, over 300px, aspect ratio between 2:5 and 5:2
- Facing roughly aligned with the video's general orientation
- Enquadramento casado com o vídeo — corpo inteiro com corpo inteiro
- Todos os membros que o movimento usa à mostra: sem bolsos, sem braços cruzados
- Nítida, mínimo de 300 px, proporção entre 2:5 e 5:2
- Orientação alinhada à direção geral do vídeo
Checklist do prompt de cena
- Atmosphere only: place, light, weather, style
- Name the look the way a gaffer would: "warm tungsten practicals, light haze"
- No action words — the video owns the choreography
- Keep wording identical when running multiple characters through one motion
- Só atmosfera: lugar, luz, clima, estilo
- Nomeie a luz como um gaffer: "tungstênio quente, névoa fina"
- Nada de palavras de ação — a coreografia pertence ao vídeo
- Para passar o mesmo movimento por vários personagens, congele a frase
Motion Control, imagem para vídeo ou mocap?
Três jeitos de mover um personagem, cada um com seu campo.
Motion Control — esta página
O movimento já existe em vídeo e precisa ser copiado com exatidão: dança, atuação, coreografia, gesto.
Imagem para vídeo
Você quer que o modelo invente um movimento plausível a partir da imagem parada — movimento solto e atmosférico descrito por prompt, não copiado de filmagem.
Pipeline de motion capture
Você precisa de dados de esqueleto com precisão de quadro para engine de jogo ou VFX. Para estilização extrema e oclusão pesada, o rig tradicional ainda paga o preço.
Como transferir movimento nesta página
Dois uploads e uma linha de cena — a ferramenta está no topo da página.
Envie o movimento
MP4 ou MOV de 3 a 30 segundos: uma pessoa visível, enquadramento estável, menos de 50 MB.
Adicione o intérprete
Imagem do personagem com enquadramento casado ao vídeo e todos os membros necessários à mostra. Escolha a geração e o modo de orientação.
Monte a cena e rode
Uma linha de atmosfera — lugar, luz, clima — e gere em 720p ou 1080p. Confira mãos e rosto em tamanho real.
Kling Motion Control: FAQ de campo
As perguntas de preparação que separam a saída boa da ruim, respondidas com documentação oficial e resultados testados.
Mantenha o personagem trabalhando
Gere filmagem nova, reescreva planos existentes, dê voz a ele.
O movimento já está filmado — troque o elenco
Envie o movimento, adicione o personagem e descreva o palco numa linha. O Kling Motion Control devolve a atuação com o seu elenco — dança, gesto e expressão intactos, em até 1080p.