Generación automática de movimientos para modelos digitales en e-commerce con HY-Motion 1.0

El contenido comercial de moda ha dejado de ser estático. En plataformas como Taobao, JD o TikTok, los usuarios esperan ver prendas en movimiento: una modelo girando para mostrar la caída de un vestido, levantando el brazo para enseñar el patrón de una manga o caminando para que el tejido fluya. Producri esos clips con captura de movimiento tradicional implica alquilar estudio, contratar actores, limpiar datos, retargetizar y renderizar, un proceso que puede costar miles de dólares y varios días por toma.

HY-Motion 1.0 es un sistema de generación de movimiento 3D a partir de texto. No requiere hardware especializado ni actores, y entrega secuencias de esqueleto humano en formato FBX listas para integrarse en herramientas como Blender o Maya. A continuación se describe cómo incorporarlo a una tubería de contenido para comercio electrónico.

Arquitectura y variantes

El núcleo de HY-Motion 1.0 es un modelo de 1.000 millones de parámetros entrenado con datos de movimiento del sector retail: pasarelas, giros de probador, gestos de presentación de prendas y transiciones de pie a sentado. El entrenamiento se basa en Flow Matching, una técnica que no genera cada fotograma de forma independiente, sino que aprende un flujo de movimiento continuo entre la postura inicial y la postura objetivo. Esto reduce los temblados articulares y las inversiones físicas imposibles que aparecen en los métodos difusos tradicionales.

Se distribuye en dos variantes:

  • HY-Motion-1.0: orientado a producción de alta fidelidad. Requiere 26 GB de VRAM. Útil para campañas publicitarias o piezas de marca donde la precisión de los dedos y hombros es crítica.
  • HY-Motion-1.0-Lite: orientado a iteraciones rápidas. Arranca en menos de 10 segundos y genera un movimiento de 5 segundos en unos 20 segundos con 24 GB de VRAM. Ideal para pruebas A/B y contenido social.

Puesta en marcha del entorno local

La distribución incluye una interfaz Gradio que arranca sin escribir código. Tras descomprimir el paquete, el servidor local se levanta con un par de comandos:

unzip HY-Motion-1.0-bundle.zip
cd hy_motion_app
chmod +x launch.sh
./launch.sh

Una vez iniciado, se accede a http://localhost:7860. La pantalla muestra un panel de texto a la izquierda y un visor WebGL a la derecha. El usuario introduce una descripción en inglés, ajusta los parámetros y presiona generar. El visor permite rotar y hacer zoom sobre el esqueleto antes de exportar el FBX.

Generación masiva desde CSV

Para producción no basta con generar movimientos uno a uno. HY-Motion expone un modo de lotes que consume un archivo CSV. El formato esperado es el siguiente:

id,motion_prompt,duration_sec,seed
M001,"A person stands upright, then lifts the left arm to shoulder height with palm facing up",5,42
M002,"A person walks forward at a steady pace, arms swinging naturally",4,108
M003,"A person pivots 180 degrees on the spot, leading with the head and following with shoulders",3,2024

El comando de ejecución se invoca desde el directorio del proyecto:

python run_batch.py \
  --input motion_list.csv \
  --out ./exports \
  --variant HY-Motion-1.0-Lite

El script procesa cada fila, genera el archivo FBX correspondiente en ./exports y mantiene la nomenclatura del identificador. Para construir movimientos complejos sin escribir nuevas descripciones, se puede crear una librería de movimientos atómicos como walk_confident, turn_180 o arm_raise_shoulder y componerlos por identificador en una columna adicional.

Redacción de instrucciones para productos de moda

HY-Motion funciona mejor con instrucciones en inglés, estructuradas y cuantificables. Evitar adjetivos subjetivos como elegant o graceful porque el modelo los interpreta de forma impredecible. Una fórmula útil es:

[postura inicial] + [acción principal] + [restricción espacial] + [control temporal]

Ejemplo para detalle de una camisa:

A person stands facing forward, raises the right forearm to chest level,
rotates the wrist until the palm faces the camera, holds for 1 second,
then lowers the arm back to the side — over 2.5 seconds.

Un ejemplo incorrecto sería:

A cool model shows off a stylish shirt in an elegant way.

La segunda versión no contiene restricciones articulares ni temporales, por lo que el resultado suele ser errático. Para el comercio electrónico es importante omitir ropa, accesorios, emociones o interacciones con objetos externos: el modelo genera solo el movimiento del cuerpo; vestuario, materiales y fondos se añaden en postproducción.

Integración con Blender y validación

El FBX generado contiene la animación de esqueleto. En Blender se importa con la orientación automática de huesos activada. Una estrategia común es importar un maniquí propio, copiar los transformes del esqueleto generado al personaje mediante restricciones y luego renderizar con Cycles activando Motion Blur. Para agilizar el trabajo se puede usar un script como el siguiente:

import bpy
from pathlib import Path

source = Path.home() / "hy_motion_exports"
output = Path.home() / "renders"

for fbx in source.glob("*.fbx"):
    bpy.ops.import_scene.fbx(filepath=str(fbx), automatic_bone_orientation=True)
    bpy.context.scene.render.filepath = str(output / f"{fbx.stem}.mp4")
    bpy.ops.render.render(animation=True)

En pruebas con marcas de ropa, los clips generados por HY-Motion obtuvieron métricas siimlares a los producidos con captura de moviimento externa: tiempo de visualización, tasa de conversión y CTR de imagen principal quedaron dentro del mismo rango estadístico, pero con un costo y tiempo de iteración considerablemente menores. La capacidad de generar decenas de variantes en horas permite pasar las pruebas A/B de mensual a diario.

Etiquetas: HY-Motion Flow Matching 3D Animation Blender Motion Capture

Publicado el 6-20 23:11