Es lo que he dicho, y ese primor que solo afecta a la parte que dices, producirá igualmente resultados distintos cada vez que lo uses sobre la misma base de imagen.
En el corazón del sistema de la tecnología actual sobre la que todo esto se sustenta está la aleatoriedad. Pretender que no sea así es imposible, se necesita algo diferente desde cero.
Es una tecnología imperfecta, sí, pero a la velocidad que avanza tengo claro que se irá perfeccionando.
Así es como funciona el sistema, y en mi opinión es así como debe funcionar en su parte "generativa".
Se trata de que invente contenido que no existe en base a una información que debe ser lo más precisa posible para que obtenga los resultados deseados.
Editar ese resultado es función de una herramienta de edición de imágenes tradicionales, que deberán incorporar esta tecnología para que las correcciones y modificaciones que queramos realizar puedan ser creadas con un simple texto que indique lo que queremos hacer, como una herramienta más en la caja de herramientas.
De momento, el secreto está en el prompt, que debe ser lo más completo posible para llevar la creación por donde queremos. El LLM que utilizan como base cada una de las herramientas ha sido entrenado con miles de millones de variables, pero son una ínfima parte sobre todo el conocimiento que ha acumulado la humanidad, y no han sido entrenados con la información específica de tu entorno, de los sistemas de las empresas u organizaciones.
Ahora mismo se está trabajando en los sistemas RAG (Retrieval Augmented Generation) que permiten complementar el conocimiento general del LLM con el conocimiento específico que quieras, conectándolo con los sistemas de información de las compañías para poder obtener resultados precisos, aunque es todo un reto conseguir que las respuestas más sencillas sean siempre las mismas.
El método que utilizo para crear las series de imágenes que os comparto utiliza el prompt para acotar el resultado, y además de decirle que quiero algo, se lo completo para darle el contexto que quiero y que las variaciones tengan sentido y sean coherentes.
Tomando como ejemplo el combate de Ali vs Lee que nos proponía ayer
@Hinomura Krycek, este sería mi prompt básico para generar un prompt específico:
Generate a prompt for a AI image generation tool, to create a signature photograph in Neil Leifer style, showing an action moment during a boxing combat between Muhammad Ali, wearing a white short with black strip, and Bruce Lee, wearing a golden short with red stripe. Mohammed is defending, covering his face with the gloves, while Bruce is punching him in the liver fiercely.
Y este sería el prompt que utilizaría:
Create a signature photograph in the iconic and perfectly timed style of Neil Leifer, capturing a high-intensity moment during a fictional boxing match between Muhammad Ali and Bruce Lee. The scene is set in a packed, electrified arena, with the crowd roaring in the background and the ring illuminated by bright, dramatic lighting.
Muhammad Ali, wearing white shorts with a black stripe, is in a defensive stance, his gloves raised to cover his face, his body slightly turned to absorb the impact. His expression is focused and strategic, showcasing his legendary defensive skills. Bruce Lee, wearing golden shorts with a red stripe, is mid-action, delivering a fierce punch to Ali's liver. His body is coiled with power, his face intense and determined, capturing his explosive speed and precision.
The composition should emphasize the dynamic energy of the fight, with sharp focus on the fighters and a slightly blurred background to highlight their movement. Sweat flies off their bodies, adding to the intensity of the moment. The lighting should be dramatic, casting strong shadows and highlighting the textures of their skin, gloves, and the ropes of the ring. The overall mood is one of power, speed, and the timeless allure of two legendary athletes in their prime, embodying the essence of Neil Leifer's ability to capture iconic moments in sports history.
¿Me ha hecho caso? Pues en el agunas cosas sí, y en otras no.
El estilo de la fotografía me cuadra y me gusta, Mohammed lleva el calzón blanco con cintura negra como le he pedido, Bruce lleva correctamente el calzón dorado, pero no la banda de la cintura no es roja como quería para representar la combinación dorado y rojo típica de china.
Y de la pose defensiva de Mohammed mientras le zurra Bruce, ni hablamos.
Así que me conformo con este par de momentos, en donde cada uno coloca su golpe.
Si quiero seguir con otra foto de la misma serie, en otro momento del combate, tengo que crear un prompt que mantenga el mismo escenario, y eso le pido a la IA:
Create another prompt, in the same scenario, after finishing the combat, with Mohammed Ali and Bruce Lee embracing each other in a gesture of fraternity
Que me ofrece este resultado:
Create a signature photograph in the iconic and emotive style of Neil Leifer, capturing a powerful moment of fraternity and respect after a fictional boxing match between Muhammad Ali and Bruce Lee. The scene is set in a packed, electrified arena, with the crowd on their feet, cheering and applauding in the background. The ring is illuminated by soft, warm light, creating a dramatic yet intimate atmosphere.
Muhammad Ali, wearing white shorts with a black stripe, and Bruce Lee, wearing golden shorts with a red stripe, stand at the center of the ring, embracing each other in a gesture of mutual respect and camaraderie. Ali's arms are wrapped around Bruce, his face showing a mix of exhaustion and admiration, while Bruce leans into the embrace, his expression reflecting humility and respect. Both fighters are glistening with sweat, their bodies bearing the marks of an intense battle.
The composition should emphasize the emotional connection between the two legends, with sharp focus on their faces and the embrace, while the background is slightly blurred to highlight the moment. The lighting should be soft and warm, casting gentle shadows and highlighting the textures of their skin, gloves, and the ropes of the ring. The overall mood is one of unity, respect, and the timeless bond between two iconic athletes, embodying the essence of Neil Leifer's ability to capture the human spirit in sports history.
Que aplico en ImageFX y obtengo el mismo escenario, la misma ropa, los mismos personajes, y en las poses que buscaba
No olvidemos que este combate nunca existió, y que la cámara de Neil Leifer tampoco estuvo allí, todo es fruto de mi imaginación con la ayuda de la IA
No sé a vosotros, pero a mí, me parece espectacular y maravilloso.
