domingo, septiembre 29, 2024

Cómo crear un Superhéroe y un Supervillano con GenAI: ChatGPT, MidJourney, Kling AI & SUNO

Llevo ya algún tiempo “jugando” a esto de generar vídeos e imágenes creadas con Inteligencia Artificial Generativa (a lo mejor me habéis visto en Cuarto Milenio con Iker Jiménez creando algunas criaturas del Sistema Solar).  Desde que empezamos con las versiones iniciales de Dall-E o Stable Diffusion, la cosa ha cambiado en cuestión de muy poco tiempo. 

Figura 1: Cómo crear un Superhéroe y un Supervillano con GenIA.
ChatGPT, MidJourney, Kling AI & SUNO

El avance es tan espectacular que ya tenemos generación de vídeo con calidad prácticamente cinematográfica, así como con imágenes reales, casi indistinguibles de la realidad.


Podría hablaros, ya que es prácticamente mi trabajo habitual, de los posibles problemas que esto puede generar o también de sus beneficios. Pero si quieres más información de cómo la ciberseguridad se fusiona con la IA, te recomiendo que comiences por este libro como punto de partida:

Figura 3: Libro de Machine Learning aplicado a Ciberseguridad de
Carmen TorranoFran Ramírez, Paloma Recuero, José Torres y Santiago Hernández

Pero hoy no. Hoy es domingo y toca hablar de algo más lúdico, divertido y relajado. Vamos a ver los pasos necesarios para crear un superhéroe y animar la escena.
 
Fase 1: ChatGPT para comenzar a crear imágnes del Superhéroe

Una vez tenemos claro los parámetros básicos de nuestro superhéroe, por ejemplo, que lleve capa, armadura, un ambiente oscuro, una ciudad de fondo, etc. Partimos de la base que mi hija de 7 años dibuja mejor que yo. Así que lo mejor es decirle a ChatGPT que prepare una imagen con la que comenzar.

Podríais pensar que lo mejor es directamente a un generador de texto a vídeo, pero no. Lo mejor es usar previamente un buen generador de imágenes y luego, el de vídeo. El motivo es la limitación del LLM que se usa en el prompt de vídeo, que no son precisamente ChatGPT.

Como para crearla voy a usar MidJourney, es una buena idea pasarle también información sobre trucos o parámetros para crear la imagen:

Figura 4: Dando más conocimiento a ChatGPT sobre MidJourney

Una vez que ChatGPT ya conoce estos parámetros, le pido que me haga un prompt para MidJourney de un superhéroe, oscuro, con un traje avanzado tecnológicamente, con una ciudad al fondo y que le añada lo que vea necesario. Este es el prompt, y será el que usemos ahora más adelante con MidJourney:

“Create a highly realistic photograph of a masked superhero wearing a spectacular, technologically advanced suit. The hero's face is concealed by a sleek, high-tech mask that adds an air of mystery. The suit is dark and aerodynamic, featuring subtle armor plating and a flowing cape. The overall design should exude strength, agility, and a vigilant presence. The setting can be a nighttime urban landscape with towering skyscrapers and dimly lit streets, emphasizing the hero's role as a guardian of the city. --no text, highly detailed, photorealistic, dramatic lighting, 8K resolution.”

Fase 2: MidJourney para crear las imágenes del Superhéroe

Ahora desde MidJourney generamos la imagen. Y estos son los resultados:

Figura 5: SuperHéroe generado con el prompt anterior.

Figura 6. SuperHéroe generado con el prompt anterior con un
"look más familiar" ;)

Genial, pero vamos ahora a ver cómo hacemos de esto un vídeo que nos quede molón, molón. Así que volvemos a ChatGPT.

Fase 3: ChatGPT ahora para crear los vídeos del Superhéroe

Repetimos lo mismo que en la fase 2, donde le decíamos a ChatGPT que creara prompt para imágenes ahora hacemos lo mismo para vídeo. En nuestro caso con Kling AI. Le pasamos un enlace para que aprenda a usar algunas técnicas, y le luego le pedimos un prompt para Kling AI pero sin complicarnos mucho, usando el contexto que ya tenemos de la generación de la imagen anterior:

Figura 7: Prompt para animación con
Kling AI partiendo de una imagen.

Aquí también le pedimos que genere un prompt negativo, para evitar que no haga lo que le pedimos, éste  es el prompt negativo obtenido:

“no cartoon style, no 2D effects, no exaggerated colors, no low resolution, no flat textures, no unrealistic lighting, no visible artificial elements, no blurry details, no oversaturation, no extra objects,”

Este punto del prompt negativo es muy importante para poder obtener resultados más precisos. Pues nada, ya tenemos todo para generar el vídeo y fundir algunos créditos ;)

Fase 4: De la imagen del Superhéroe al vídeo con Kling AI

Ahora desde Kling AI, usamos la opción “image to video”, ponemos la imagen anterior generada, usamos el prompt principal y el prompt negativo, cada uno en su posición:

Figura 8: Generación de los vídeos con Kling AI.

Y finalmente, tenemos estos dos vídeos como resultado:

Figura 9: Vídeo generado a partir de la imagen de la Figura 6
    
Figura 10: Vídeo generado a partir de la imagen de la Figura 5

Pero aún podemos hacer que esto sea mucho más épico. Vamos a ponerle un nombre y a crear música para generar mucho más impacto con estos vídeos.

Fase 5: A todo superhéroe se le conoce con un nombre …

Pues nada, directamente con la imagen generada con MidJourney le pedimos a ChatGPT que nos diga algunos nombres originales. 

Figura 11: Nombres sugeridos para este superhéroe
(lo que antes se llamaba hacer un BrainStorming)

Esta es la lista de diez nombres que me ha ofrecido traducidos - con ChatGPT - al Español. ¿Cuál te gusta más? ;)
  1. Fantasma Nocturno
  2. Vanguardia Sombría
  3. Centinela Oscuro
  4. Caballero Fantasma
  5. Sombra de Hierro
  6. Guardián de Medianoche
  7. Guardián del Eclipse
  8. Espectral
  9. Vengador de Obsidiana
  10. Furia Silenciosa
Fase 6: Y ya que estamos ¿le ponemos banda sonora?

Para una banda sonora acorde a nuestro superhéroe, también podemos hacer que lo haga ChatGPT, por ejemplo con este prompt y lo ponemos en SUNO AI:

“Epic, electronic instrumental orchestral track beginning with a slow, atmospheric intro featuring deep synths and subtle beats to build tension. Gradually add a driving and dark ambient”

Figura 12: Creación de la banda sonora con SUNO AI.

Aquí tienes la canción completa por si la quieres escuchar:


Y ahora ya podemos montar con el iMovie o el Premier, el vídeo, con la música completa, lo que nos da un resultado espectacular para la creación de nuestro superhéroe.

Figura 14: Todo montado con nuestro superhéroe

Reflexión final

Como podéis ver, la combinación de varias herramientas de GenAI puede dar resultados espectaculares. Y esto ha sido una demo rápida, si lo pensamos, le dedicamos más tiempo a los prompts, a los parámetros, etc seguro que obtenemos resultados realmente espectaculares. Esto es sólo una pequeña muestra de lo que la IA puede hacer, no cometas el error de ignorarlo o decir que esto es una moda pasajera y que no se puede hacer nada “útil” con la IA

Happy Hacking Hack…!!!! … espera un momento …

Bonus Track: El Súpervillano  

Se me olvidaba, todo superhéroe tiene un villano ¿verdad? ;)

Figura 15: Generación del villano con MidJourney.

Le buscamos un nombre con ChatGPT.

Figura 16: Nombres propuestos por ChatGPT para el villano

Pero le puedes pedir más, aquí algunos traducidos al Español de una nueva batida de ideas.
  1. Malikar, el Rompealmas
  2. Noctyros
  3. Vorlath, el Caminante del Abismo
  4. Xyphor, Señor de la Ruina
  5. Erebus Vorn
  6. Zal'Korath, el Emperador del Vacío
  7. Nyxarion
  8. Draethor, la Forja de Sombras
  9. Morvex el Eterno
  10. Kael'dryn, el Rey de la Tormenta
Ahora vamos a hacerle una banda sonora acorde a su maldad en SUNO AI.

Figura 17: Prompt en SUNO AI para el villano

Que nos genera este pedazo de temazo.

Figura 18: Shadow King hecha con SUNO AI

Y aquí os dejo el vídeo animado con Kling AI, ya montado con su música y todo ;). Malvado total.

Figura 19: Todo montado con nuestro superhéroe

La IA está aquí, así que aprende, y sobre todo disfruta el momento tecnológico que estamos viviendo, te lo dice uno que empezó con pantallas de fósforo naranja y texto y sin Internet ;)

Ahora sí...

Happy Hacking Hackers!!!

Autor: Fran Ramírezes investigador de seguridad y miembro del equipo de Ideas Locas en CDO en Telefónica, co-autor del libro "Microhistorias: Anécdotas y Curiosidades de la historia de la informática (y los hackers)", del libro "Docker: SecDevOps", también de "Machine Learning aplicado a la Ciberseguridad” además del blog CyberHades. Puedes contactar con Fran Ramirez en MyPublicInbox.

 Contactar con Fran Ramírez en MyPublicInbox

No hay comentarios:

Publicar un comentario