¿Con la inteligencia artificial ha llegado el fin de los diseñadores gráficos?

Share on facebook
Share on whatsapp
Share on twitter
Share on linkedin
Share on pinterest
Hablamos de IA, porque la inteligencia artificial no deja de asombrarnos. El 2021 empieza con una innovación impresionante que se llama DALL·E ofrecido por OpenAI. Os estaréis preguntando ¿De qué se trata?
inteligencia artifíciale posible tecnologías futuras - Aqia marketing

Creación de imágenes a partir del texto gracias a la inteligencia artificial.

La creación de imágenes a partir del texto es bastante fácil de explicar pero ha sido muy difícil de conseguir. 

En pocas palabras, tú pides lo que quieres, utilizando conceptos que se pueden expresar con un lenguaje natural, después redactas un texto y como resultado, él crea imágenes a partir de tus palabras.

Casi nadie conoce esta tecnología porque el artículo de la empresa que está desarrollando esta herramienta estrenó el proyecto el 5 de enero de 2021, han pasado sólo un mes mientras tanto, todo el mundo de la comunicación digital está flipando. 

Más abajo te dejaré el enlace para ir tú mismo a ver la página web de la empresa. 

Es fácil comprender que este proyecto de OpenAI lo va a cambiar todo.

DALL·E es una inteligencia artificial desarrollada para generar imágenes utilizando un conjunto de datos integrado con imágenes y textos, pero no se limita a buscar la imagen más adecuada sino la crea.

Por lo tanto, tiene la inteligencia de crear versiones antropomorfizadas de animales y objetos.

Además, combina conceptos no relacionados de manera plausible, transformando los objetos y representando fielmente los textos introducidos.

Si por ejemplo, le escribimos un mensaje de texto como este: “Un sillón de forma aguacate

Nos hará ver estas imágenes.

imagenes inteligencia artificial DELL

Entonces ¿Qué es DALL·E? ¿Qué es una inteligencia artificial?

Es una red neuronal artificial con un conjunto de neuronas artificiales conectadas entre sí para elaborar información. 

Los datos entrantes atraviesan la red neuronal y se someten a muchas elaboraciones hasta a producir un valor de salida.

Lo más notable, es que este sistema aprende y se forma a sí mismo en lugar de ser programado de forma explícita. Pues, produce un aprendizaje automático.

El desafiante objetivo de la red neuronal es resolver los problemas de la misma manera que el cerebro humano. Actualmente, las redes neuronales pueden contener desde unos miles a unos pocos millones de unidades neuronales. 

En consecuencia, no estamos ni cerca del celebro humano.

Es decir, los miles de millones de neuronas que constituyen nuestra inteligencia.

Por supuesto, el camino es largo, pero los resultados ya se pueden ver por ejemplo, en el reconocimiento de voz. O en la elaboración de la búsqueda semántica utilizada por Google con su algoritmo Hummingbird. Introducido en el 2013 en el motor de búsqueda a beneficio de millones de usuarios, una auténtica transformación digital.

La IA utilizada por parte del gigante de internet permite ofrecer información mucho más relevante entendiendo la intención de un buscador a través del significado contextual redactado en su búsqueda. 

Esta IA tiene la capacidad de interpretar múltiples significados en un aprendizaje continuo.

OpenAI está utilizando un nuevo modelo de lenguaje capaz de programar, diseñar y conversar sobre política o economía. ¿Es asombroso verdad?

Descubrimos las capacidades de esta inteligencia artificial.

Este modelo de lenguaje se llama GPT-3 y ha sido entrenado con una ingente cantidad de información, por un lado, todos los libros públicos que estén disponible online y toda Wikipedia, por otro lado, millones de páginas web y documentos científicos disponibles en Internet.

Es muy importante entender que todas las respuestas que ofrece GPT-3 son sólo algunas posibilidades.

Este modelo devuelve respuestas en función a lo que se ha escrito y relacionándolo con todo lo que ha aprendido previamente.

Por esta razón, frente a la misma petición puede ocurrir que su respuesta sea distinta o contradictoria pero, obteniendo siempre el resultado final con más sentido.

Gracias a este espectacular proceso de aprendizaje DALL·E puede generar imágenes desde cero, elaborando todos sus conocimientos.

Esta capacidad se convierte en el crear imágenes plausibles para una amplia variedad de oraciones que exploran la estructura del lenguaje.

Por ejemplo, es capaz de controlar simultáneamente varios objetos, sus atributos, y las relaciones espaciales. Además, nos asombramos descubriendo que DALL·E permite controlar el punto de vista de la imagen renderizando la escena en 3D

Estas son imágenes creada por DALL·E, intentando reproducir el mensaje de texto:

Una vista de primer plano de un puma sentado en un campo

Si te parece sencillo traducir un texto en una imagen, vas a flipar enterándote de la capacidad que tiene de inferir detalles contextuales.

Una sola frase generalmente corresponde a miles de sentidos plausibles, es decir que no está determinada en una única imagen. Existen conceptos que permanecen ocultos. Por ejemplo, la orientación del objeto, su sombra, ángulo, cómo otros detalles no redactados explícitamente. 

Voy a explicarme con un ejemplo.

Mensaje de texto: 

Una pintura de un Puma sentado en una montaña en el crepúsculo

Cómo puedes observar, es capaz de dibujar el mismo objeto en situaciones diferentes cambiando estilo, entorno y tiempo.

diseño de un puma en la montaña por la inteligencia artificial

A través del lenguaje neuronal, DALL·E puede controlar de forma independiente los atributos de los objetos, ordenarlos entre sí, controlar la ubicación, el ángulo de la escena y las condiciones de iluminación…WOW

Puedes verlo tú mismo en la imagen anterior, teniendo siempre en cuenta, que son imágenes creadas y no son reales ni copiadas.

¿Es capaz de combinar conceptos no relacionados?

Por supuesto! Cuándo escribimos un texto para que DALL·E pueda traducirlo en una imagen con objetos no relacionados.

El lenguaje nos permite unir conceptos para describir la realidad o la fantasía, de la misma forma la IA puede conseguir.

A continuación vamos a ver dos ejemplos de conceptos no relacionados.

“Un caracol hecho de cubo de rubik”
caracol hecho de cubo re rubik
“Un erizo hecho de pepino”
erizo de pepino

¡Es fantástico! Podemos concluir que la IA del lenguaje GPT-3 puede realizar muchas tareas únicamente a partir de una descripción escrita. 

Sus conocimientos y aprendizaje continuo se basan sobre datos geográficos, las variaciones de los objetos con el variar del tiempo, la información introducida en el texto y, en definitiva los datos implícitos. 

En este momento OpenAI está midiendo la aptitud de DALL·E para problemas de razonamiento analógico, probándolo en las matrices progresivas de Raven, o lo que es lo mismo, se trata del test para el coeficiente intelectual. 

Sí lo sé, es increíble lo que la ciencia está ofreciendo al mundo digital, y no sólo, también tendrá impacto con todos los servicios, online y sobre todo, en nuestra rutina. 

Ahora como te prometí, puedes ver la eficacia de la red neuronal artificial, jugando con el texto aquí

Un gran abrazo

Biagio Chiurazzi

aqia logo perfil social media

Si quieres saber más y profundizar sobre el tema. Por fin, descubrir cómo aprovechar de las ventajas digitales, contáctanos.

¿Hablamos? Con-tacto

Añadir un comentario

Tu correo electrónico no será publicado. Los campos requeridos están marcados

Últimas entradas:

¿Nos sigues?

Shopping Basket