Kann FLUX.1 den milliardenschweren Markt der KI-Bildgeneratoren rocken?
Kostenlos fotorealistische KI-Bilder generieren
25. September 2024 – In letzter Zeit explodierte die Anzahl der KI-Bildgeneratoren. Als OpenAI, das Unternehmen, das ChatGPT entwickelte, 2021 sein Bildgenerierungsmodell DALL-E veröffentlichte, erregte dies großes Interesse, da Text-zu-Bild-Modelle zu diesem Zeitpunkt noch unbekannt waren.
Als jedoch immer wieder aktualisierte Modelle von OpenAI veröffentlicht wurden, wurde der Welt langsam klar, wie diese Entwicklung gleich mehrere Branchen und besonders das MArketing auf den Kopf stellen würde.
Der Milliardenmarkt für KI-Bildgeneratoren
Heute erwirtschaftete der globale Markt für KI-Bildgeneratoren laut einer Horizon-Studie (Quelle: https://www.grandviewresearch.com/horizon/outlook/ai-image-generator-market-size/global) im Jahr 2023 einen Umsatz von 349,6 Millionen US-Dollar und soll bis 2030 1,081 Milliarden US-Dollar erreichen.
Viele Unternehmen verwenden bereits KI Bildgeneratoren zur Erstellung von Werbung, da sie dadurch enorm Kosten senken können.
Vielleicht hast du kürzlich den neuen Coca-Cola-Spot gesehen, der als AI-Meisterwerk gefeiert wird, oder bist einem der zahlreichen KI-Influencer begegnet, die Markenwerbung betreiben. Die Use-Cases für die KI sind endlos.
Auch der E-Commerce-Riese Amazon verwendet KI-generierte, realistisch aussehende Modelle zur Erstellung von Ads.
Der umkämpfte Markt der KI Bildgeneratoren
Es gibt mittlerweile zig Unternehmen, die auf dem lukrativen Markt für KI-Bildgeneratoren tätig sind. Einige davon sind Midjourney, Adobe, OpenAI, Stability AI, Google, Microsoft, Leonardo AI, Runway AI, Inc. und viele mehr.
Bis Juli 2024 waren die Marktführer bei den KI-Generationsmodellen Midjourney V6.1, OpenAI’s Dalle-E 3 und die Stability AI Stable Diffusion-Modelle (Open Source).
Am 1. August 2024 brachte jedoch ein Startup namens Black Forest Labs das FLUX.1 Modell auf den Markt (Link zu FLUX.1), was einige Branchenexperten und einige der führenden KI-Bildgenerator-Unternehmen nervös machte.
Warum? Weil FLUX.1-Modelle einige der realistischsten Bilder generieren kann, die man bisher im KI-Bereich gesehen hat – und das Beste daran ist wohl die Open Source Architektur.
Der neue KI-Trend – FLUX.1
FLUX.1 ist eine Reihe von Modellen, die ein neues Maß an Detailgenauigkeit, Prompt-Einhaltung, Stilvielfalt und Szenenkomplexität für die Text-zu-Bild-Generierung definieren.
Das für das Startup verantwortliche Team besteht aus den ursprünglichen Entwicklern der Technologie, die hinter Stable Diffusion steckt, und den Erfindern der „latent diffusion“ (Quelle: https://arxiv.org/abs/2112.10752). Das Unternehmen hat seinen Sitz in Deutschland und sammelte 31 Millionen US-Dollar Startkapital ein. Im Vergleich z. B. investiert der US-Konzern Microsoftbis Ende 2025 mehr als drei Milliarden Euro in sein deutsches Geschäft mit Künstlicher Intelligenz (allerdings auch für den Ausbau seiner Rechenzentren für die KI-Anwendungen).
FLUX.1 hat drei Modelle:
FLUX.1 Pro
Dies ist das „Flaggschiff“-Modell, das für seine außergewöhnlichen Fähigkeiten in Bezug auf Prompt-Following, Bildqualität, Bildgranularität und Ausgabevielfalt bekannt ist. Es nutzt fortschrittliche KI-Technologien, darunter Diffusionsmodelle und Transformer-Architekturen, wodurch es qualitativ hochwertige Bilder erzeugen kann, die selbst komplexe Textaufforderungen genau wiedergeben. Dieses Modell ist hauptsächlich über eine API verfügbar und eignet sich für die kommerzielle Nutzung, was es ideal für professionelle Anwendungen macht.
FLUX.1 Dev
Dies ist eine „destillierte“ Version von FLUX.1 Pro, die speziell für die nicht-kommerzielle Nutzung entwickelt wurde. Es behält eine ähnliche Qualität und Prompt-Einhaltung wie FLUX.1 Pro bei, ist aber effizienter als Standardmodelle derselben Größe. Dieses Modell ist offen, sodass Benutzer ohne kommerzielle Einschränkungen darauf zugreifen und es für persönliche und Forschungszwecke verwenden können.
FLUX.1 Schnell
Dies ist das schnellste Modell in der FLUX-Modellreihe, optimiert für lokale Entwicklung und persönlichen Gebrauch. Es ist unter einer Apache 2.0-Lizenz frei verfügbar und damit für Benutzer zugänglich, die mit der KI-Bildgenerierung experimentieren möchten, ohne den Einschränkungen einer kommerziellen Lizenzierung. Bei diesem Modell stehen Geschwindigkeit und Effizienz im Vordergrund, sodass es sich für das Rapid Prototyping und persönliche Projekte eignet.
Und hier kannst du FLUX.1 kennenlernen
Der beste Weg, auf das FLUX.1-Modell zuzugreifen, ist über Hugging Face (Link: https://huggingface.co/), ein bekanntes KI-Unternehmen und eine Community-Plattform, die sich auf die Verarbeitung natürlicher Sprache (NLP) und maschinelles Lernen konzentriert. Die Plattform ist zum zentralen Knotenpunkt der KI-Community geworden, insbesondere für diejenigen, die an sprachbezogenen KI-Aufgaben arbeiten. Um die entsprechenden Modelle zu verwenden, suchst du diese dort einfach. Für FLUX.1 DEV kannst du direkt zum FLUX.1 Dev-Bereich gehen und kannst dort deine Prompts eingeben und experimentieren (Link: https://huggingface.co/spaces/black-forest-labs/FLUX.1-dev).
Prompt: a tiny astronaut hatching from an egg on the moon
Auf Hugging Face kannst du auch auf den „FLUX.1 Schnell„-Bereich zugreifen (Link: https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell) und Bilder generieren. Es gibt jedoch keine offiziellen Bereiche, in denen du über Hugging Face auf FLUX.1 Pro zugreifen kannst.
Eines der Probleme bei der Verwendung von Hugging Face besteht darin, dass die Nutzungshäufigkeit begrenzt ist. Dies liegt daran, dass jeder gehostete Modelle verwenden kann. Dies führt dann oft zu längeren Wartezeiten.
Black Forest Labs ist eine Partnerschaft mit mehreren Partnern eingegangen, darunter fal.ai (Link: https://fal.ai/models), replicate (Link: https://replicate.com/black-forest-labs), Freepik (Link: https://www.freepik.com/pikaso/ai-image-generator) und viele ähnliche Plattformen. Es gibt kostenlose und kostenpflichtige Pläne, und du kannst dir je nach Bedarf den für dich passenden Plan auswählen.
Ich habe das Premium-Abonnement von Freepik – zum Generieren von Bildern mit allen FLUX.1-Modellen – abgeschlossen und es ist vergleichsweise günstig (günstigster Plan: 60 Euro/Jahr).
Freepik bietet alle FLUX.1.Modelle
In Freepik müssen die entsprechenden FLUX-Modelle als Modus ausgewählt werden:
Flux Fast-Modus = FLUX.1 Schnell
Flux-Modus = FLUX.1 Dev
Flux Realism-Modus = FLUX.1 Pro.
Ich habe Freepik ausgewählt, weil ich die Plattform schon früher verwendet habe. Du kannst natürlich gerne etwas anderes auswählen oder einfach Hugging Face verwenden.
Einige Beispiele mit den FLUX.1-Modellen generiert
Die von FLUX.1 generierten Bilder sind beeindruckend.
Es hat eine blühende und engagierte Community aus Entwicklern und Benutzern, die dabei helfen, es immer besser zu machen. Und da es Open Source ist, können Benutzer das Tool anpassen und neue Funktionen hinzufügen.
Sehen wir uns doch einfach einige Beispiele an, die verdeutlichen, wie gut mit FLUX.1 generierten die Bilder sind.
Ein Plakat mit Text in dem Bild einer Filmszene
Prompt: A young woman interacts with a futuristic, complex machine aboard the Nostromo spaceship. The wide shot reveals an array of distinct machines featuring intricate, biomechanical designs inspired by H. R. Giger and the surreal geometry of Escher. Elaborate, mechanical body extensions protrude from the walls, blending seamlessly into the ship’s structure. The scene captures a unique holiday dad core aesthetic, juxtaposed with absurdist installations evocative of Stanley Kubrick's visionary filmmaking. The woman prominently holds a whiteboard with the text 'I LOVE THE EARTH' displayed in bold, striking contrast against the surreal environment.
Du kannst im Grunde jedes Szenario erstellen, in dem eine Person oder Figur ein Schild mit Ihrem Namen oder einem beliebigen Text darauf halten kann.
Eine der Schwachstellen ist ja bisher wohl die Textwiedergabe beim Generieren eines KI-Bildes – obgleich sich das in Midjourney 6.1 schon etwas verbessert hat. Mit den Modellen von FLUX.1 gibt es dieses Problem überhaupt nicht mehr (zumindest mit englischen Texten). Du kannst im Grunde einfach in deinen Prompt den gewünschten Text eingeben und so jedem Motiv hinzufügen.
Porträt einer spanischen Großmutter
Prompt: Old family Spanish portrait, candid image, vintage effect, short very old Spanish woman, typical Spanish grandma clothing, in her house, in the middle of a Spanish Mediterranean countryside documental photography, real person, intricate natural lights reflecting in her
Die von FLUX.1 Pro und Midjourney v6.1 generierten Bilder sind äußerst realistisch. Beide Modelle übertreffen die Erwartungen, und in einigen Fällen sind die Bilder von FLUX.1 Pro oft detaillierter und realistischer und übertreffen sogar oft die Bilder von Midjourney. Teste es einfach mal selbst aus!
Cyborgs übernehmen die Jobs der Menschen
Prompt: Cyborgs taking the human jobs in the dystopian future.
Mir persönlich gefiel das Cyborg-Design, das ich mit Midjourney generierte, besser. Aber die prompte Umsetzung von FLUX.1 Pro ist präziser. Midjourney ist dafür bekannt, Bilder präzise zu erstellen, aber FLUX.1 Pro funktioniert noch besser.
Selbstporträt einer Frau auf der Party
Prompt: Selfie, self-portrait of a woman at the party, candid, ultra-wide-angle, distinct facial features, neon lights, red, everyday outfit, 4k
Texte in Bildern
Prompt: “kolibri” appears in gigantic metallic letters in the middle of the scene, a rugged spaceship on the Martian ground, a Middle-Eastern male astronaut in a dark spacesuit investigating the environment, with swirling cosmic clouds in the background.
Denke an all die Möglichkeiten, die du bei der Erstellung von Inhalten, für Social Media oder bei Produktwerbung mit attraktiven Motiven wie diesem nutzen kannst. Ändere einfach Text und Thema, und du erhältst mit jeder Iteration äußerst attraktive Illustrationen.
Zeige einfach eine Nachricht aus deinem Zimmer an
Prompt: Authentic share, slightly blurry, amateur quality phone photo, everyday realism, smartphone quality, natural light: Young woman taking selfie in living room. Casually dressed, minimal or no makeup. Holding paper with handwritten “I am not real” clearly visible. Soft natural light from nearby window. Couch, palm and home decor visible in background.
Wie geht es weiter?
Jeden Tag werden die Bilder von Bildgeneratoren verfeinert, besser und erzeugen Bilder, die extrem schwer als KI-Bilder zu erkennen sind. Ganze Branchen nutzen bereits KI Tools zu ihrem Vorteil. Agenturen setzen diese Technologie bereits ein, um KI-Influencer zu erfinden, die jetzt Millionen verdienen. Im E-Commerce steckt dazu noch ein riesiges Potenzial. Der Moderiese Mango hat gerade eine Kampagne mit einem KI-generierten Model veröffentlicht.
Die Anwendungsfälle sind endlos und die Bildgeneratorbranche befindet sich im Aufwärtstrend. Ob sie bis 2030 eine Milliardenbranche sein wird? Ich denke (leider?) ja!
Quellen: Vivek Naskar · Artrikel veröffentlicht in Level Up Coding, übersetzt von kolibriTRAINING und Anpassung sowie Generierung der Prompts und Beispiele; Hugging Face; Blackwood Forest Labs; FLUX1.ai; Freepik; kolibriTRAINING M. Laeger
Unsere Midjourney und KI Schulungen für die Praxis:
Alle Schulungen zu den Themen Midjourney und Firefly, auch in Kombination mit Photoshop oder Illustrator findest du in unserer Kategorie „KI Schulungen“.