#procesos #motion #IA
Todo empezó con un descarte. O más bien con 111 descartes.
Estaba probando el comando --sref random en Midjourney sobre una imagen de una chica con un chicle, para explorar estilos y guardarme aquellos que me encajasen para futuros proyectos.
Al final no sé muy bien qué pasó, pero acabé generando 111 imágenes de chicas haciendo una pompa de chicle. Cien-to on-ce.
En parte fue porque no daba con lo que buscaba, pero también reconozco que caí en la trampa de la IA: ese bucle de hacer solo una prueba más a ver si la siguiente sale perfecta. Como era un proyecto personal sin fecha de entrega, podía iterar hasta el infinito. Y asi fue 😅
Parecía tiempo y créditos tirados a la basura. Esas 111 imágenes se quedaron guardadas en una carpeta durante un tiempo, estancadas
Lo que en principio parecía inútil, acabó siendo la clave
Un día, haciendo scroll en LinkedIn, la idea hizo clic. Había tanto ruido, tanta afirmación categórica, tanta teoría sobre IA sin aterrizar en nada práctico, esa sensación de urgencia constante por no quedarse atrás... la burbuja tecnológica parecía a punto de estallar. Y esa sensación encajó perfectamente con el material que tenía guardado. Esas 111 imágenes inútiles de diferentes personas inflando la misma pompa se convirtieron en la representación visual perfecta de la idea central que había tras POP.
Ya tenía la base. Ahora “solo” me faltaba la escena de la pompa explotando.
En redes por lo general, se suele enseñar el resultado final limpio y sin errores (o con los fallos muy bien disimulados). La realidad es que pedirle a la IA una acción tan específica como "una pompa de chicle estallando" yo creo que casi rompí el modelo.
La IA es iteración: es prueba, error, gastar créditos y cruzar los dedos para que el modelo entienda algo de tus prompts
Lo que a priori a nivel físico parece un acción simple, en generación de vídeo se traduce en un catálogo de deformaciones y acciones aleatorias. Y no por falta de precisión técnica: para estructurar los prompts utilicé un GPT personalizado (AI Video Prompt Generator for Veo2, Kling, Runway). Aun así, algunos resultados fueron directamente perturbadores. Aqui tenéis algunos con sus respectivos prompts y modelos:
Al final, la solución fue dejar de buscar el prompt perfecto y dividir el plano por necesidades técnicas:
Kling 1.6 Standard: Lo usé exclusivamente para la acción de inflar el chicle. Fue el modelo que mejor entendió la física del chicle inflándose.
VEO 2: Lo utilicé para el momento de la explosión y las salpicaduras de chicle.
Cuando me preguntan qué modelo es mejor para hacer qué, personalmente creo que no hay un modelo definitivo. Gana el que resuelve tu plano en ese momento.
Conseguida la imagen, me puse con el guion y el sonido. Trabajé el texto base con ChatGPT para darle forma a la narración y para la locución usé ElevenLabs. Elegí la voz de Ivanna , Girl Next Door porque suena muy natural, sin tono de anuncio ni inflexiones de podcast. Eso sí, en la IA al igual que con la imagen, la voz rara vez sale como quieres a la primera. Tocó hacer varias pruebas e iteraciones hasta clavar el tono.
Para terminar de pulir el sonido, añadí un murmullo de cafetería de fondo y lo mezclé con otras voces secundarias diciendo frases aleatorias sobre IA que escuchamos todos los días. Quería generar un desorden sonoro intencionado, casual y realista.
Siento que la IA brutal para empezar las cosas, ya no se tiene que partir de un lienzo en blanco, te permite generar ideas a una velocidad impensable hace un par de años, pero cuando toca aterrizar esas ideas, hilar fino y buscas un empaque visual concreto, no hay atajos: en mi caso, sigo necesitando el entorno tradicional.
La IA sirve para arrancar, pero el control real del detalle sigue estando en las herramientas de siempre
En After Effects:
Filtro timewarp para la sucesión acelerada de las 111 chicas.
Máscara circular y un wiggle para simular las imperfecciones de movimiento que haces al soplar un chicle.
Desenfoque en el centro para integrar las bocas que salían demasiado nítidas en las imágenes.
En Premiere:
Montaje final, subtítulos (siempre amarillo sobre negro por legibilidad) y mezcla de audio con Essential Sound.
Lo que me llevo de este proyecto:
Ese material descartado por el que te autoflagelas pensando que has tirado el tiempo a la basura, a veces es exactamente el punto de partida de la siguiente idea.
La IA exige flexibilidad. Tienes que aprender a rescatar lo útil de lo que te da, en lugar de forzarla a darte exactamente lo que imaginabas.
Las herramientas de toda la vida siguen siendo imprescindibles para darle ese control de calidad en el detalle.
Y ahora que ya conocéis las tripas del proceso, aquí tenéis el resultado final. Espero que lo disfruteis.