Arte computacional

From Wikipedia, the free encyclopedia

El arte computacional o arte por computadora es el que consta del tratamiento de imágenes creadas con un ordenador para determinados procesos creativos, siendo desde fotografías manipuladas hasta el diseño de paisajes y retratos.

Para lograr su cometido se utiliza software especial combinado con dispositivos interactivos como escáneres, cámaras digitales, bolígrafos y tabletas digitalizadoras. En tiempos recientes las creaciones finales son mayormente aplicadas en publicidad y cinematografía.

Modelo de transformación de texto a imagen

El modelo de transformación de texto a imagen (modelo T2I o TTI) es un modelo de aprendizaje automático que recibe como entrada una indicación en lenguaje natural y crea una imagen que corresponde a esa descripción.[1][2][3]

El desarrollo de modelos de transformación de texto a imagen comenzó a mediados de la década de 2010,[4] a principios del auge de la inteligencia artificial, gracias a los avances en redes neuronales profundas. En 2022, los resultados obtenidos por modelos modernos de transformación de texto a imagen, como DALL-E 2 de OpenAI, Imagen de Google Brain, Stable Diffusion de Stability AI, Midjourney y Gen-4 de Runway, comenzaron a considerarse cercanos en calidad a fotografías reales y obras de arte dibujadas.

Los modelos de transformación de texto a imagen suelen ser modelos de difusión latente,[5][6][7] que combinan un modelo de lenguaje, que transforma el texto de entrada en una representación latente, y un generador de imágenes, que crea una imagen condicionada por dicha representación. Los modelos más eficientes generalmente se entrenan con grandes volúmenes de datos de imágenes y texto obtenidos de internet.[8]

El generador de texto a imagen con inteligencia artificial (IA) es una solución de software diseñada para transformar automáticamente descripciones textuales en imágenes visuales. Estas herramientas se utilizan activamente en diseño, marketing, educación y producción digital de contenido. Permiten crear ilustraciones originales, visualizaciones y elementos gráficos sin la necesidad de dibujo manual o habilidades complejas en editores gráficos.[9]

La evaluación y comparación de la calidad de los modelos de transformación de texto a imagen es una tarea que requiere valorar múltiples propiedades deseables. Un requisito característico de estos modelos es la correspondencia semántica entre las imágenes generadas y las descripciones textuales usadas para su creación. Para evaluar estas cualidades, se han desarrollado varios esquemas, algunos automatizados y otros basados en el juicio humano.[10] La IA tiene el potencial para una transformación social, que puede incluir la expansión de nichos no comerciales especializados (como derivados del cyberpunk, tales como el solarpunk) por aficionados, nuevos entretenimientos, prototipado rápido, aumento de la accesibilidad para la creación de obras artísticas, y resultado artístico en relación con el esfuerzo, costo o tiempo invertidos, por ejemplo, mediante la creación de borradores, definiciones de borradores y componentes de imágenes (inpainting). Las imágenes generadas a veces se usan como bocetos, experimentos de bajo costo, inspiración o ilustraciones de ideas en la etapa de validación de conceptos.[11] Funciones adicionales o mejoras también pueden referirse a la edición manual posterior a la generación (por ejemplo, pulido), como la posterior refinación mediante un editor de imágenes.

Referencias

Related Articles

Wikiwand AI