FLUX.1
Programm zur Erschaffung von KI-Kunst
From Wikipedia, the free encyclopedia
FLUX.1 ist eine Anwendung von Künstlicher Intelligenz (KI), die in der Lage ist, aus Textbeschreibungen KI-Kunst zu erschaffen. Das proprietäre Programm wurde vom deutschen Start-up-Unternehmen Black Forest Labs Inc. mit Sitz in Freiburg im Breisgau entwickelt.

Funktionsweise
Die FLUX.1-Text-zu-Bild-Modellfamilie basiert auf einer hybriden Architektur, die multimodale und parallele Diffusion-Transformer-Blöcke kombiniert (Stable Diffusion).[1] Das KI-Tool steht kostenlos in drei Varianten (pro/dev/schnell) zur Verfügung. Wie die meisten KI-Bildtools lässt sie sich mit Prompts bedienen.[2]
Beim sogenannten ELO-Score, der die Leistungsfähigkeit von KI-Systemen bewertet, schnitt FLUX.1 Mitte 2024 besser ab als die Bildgeneratoren DALL-E 3 von OpenAI und Midjourney.[3][4][5]
Kritik
Die Software steht unter Kritik. Darstellungen reichten laut Medienberichten von einem mit Waffen posierenden Donald Trump bis hin zu verstörenden Szenen, was Diskussionen über die ethischen Implikationen der Technologie auslöste.[6] Medienberichten zufolge wurde das soziale Netzwerk X nach Veröffentlichung des KI-Tools mit FLUX.1-generierten Bildern überflutet.[7][8] Black Forest Labs macht keine Angaben zu den verwendeten Trainingsdaten. Ars Technica vermutet, dass FLUX.1 auf einer großen, nicht autorisierten Sammlung von Internetbildern basiert, eine umstrittene Praxis mit möglichen rechtlichen Konsequenzen.[9][10]
Publikationen
- Robin Rombach, Andreas Blattmann, Dominik Lorenz, Patrick Esser, Björn Ommer: High-Resolution Image Synthesis with Latent Diffusion Models (2021). doi:10.48550/arXiv.2112.10752
- Laurie Ravello: Mastering FLUX.1 AI: A Comprehensive Guide to Generative Art and Design. Eigenverlag, 2024, ISBN 979-83-3611690-8.
Galerie
Beispiele für mit FLUX.1 generierte Bilder:
- Eine Synthographie eines malerischen Waldes im Tal am späten Nachmittag mit Haus und Fluss.
- Eine indische Schauspielerin trägt einen gelben Sari in einem roten Raum, vor ihr stehen 3 Kisten.
- Anthropomorphes Nashorn auf dem Broadway in New York City.
- Ein älterer japanischer Schneider arbeitet an seinem Nähtisch in Nagasaki.
- 10er-Tablettenpackung, deren Tabletten mit Logos verschiedener sozialer Medien bedruckt sind.