Der Realismus der KI-generierten Bilder überzeugt: FLUX.1 von Black Forests Labs ist derzeit in der Tech-Szene in aller Munde. Die aus dem Schwarzwald stammende Technologie bildet die Grundlage für ein weiteres Bildgenerierungs-Tool mit Gen AI Support, das mit DALL-E 3, Midjourney, Adobe Firefly und Co. konkurriert. Viele User sehen im Vergleich aber einen Vorteil bei FLUX.1. Denn die Bilder lassen sich mitunter kaum von echten Fotografien unterscheiden, nicht mal mit Blick auf die Hände. Besonders ein Bild sorgt für Aufsehen. Am Hype rund um das Tool sind aber auch andere KI-Unternehmen indirekt beteiligt.
TED Talk wie fotografiert: Ein Bild von FLUX.1 fasziniert die Branche
In den sozialen Medien kursiert dieser Tage ein Bild, das eine Frau bei einem TED Talk zeigt, mit Mikro in der Hand, Lanyard um den Hals und einem Ring am Finger, mit einem breiten Lächeln und gut sichtbaren einzelnen Strähnen des offenen Haars, die sogar Schatten werfen. Es handelt sich aber nicht um ein Foto, sondern um ein KI-generiertes Bild von FLUX.1. Und das verblüfft, weil das Bild so realistisch wirkt.
Noch lebensechter wird es, wenn das statische Bild zum Video stilisiert wird, wie es mit Runways Gen-3 Alpha gemacht wurde.
Die positiven Stimmen zum Tool erfahren gerade in Deutschland viel Beachtung, da das Unternehmen hinter dem Tool aus Deutschland kommt. Anfang August wurde Black Forest Labs vorgestellt. Dabei wurde bereits eine Finanzierung von 31 Millionen US-Dollar, angeführt von Andreessen Horowitz, bekanntgegeben. Zum Team des Unternehmens gehören KI-Experten, die bereits an der Entwicklung von Stable Diffusion mitgearbeitet haben und für Runway tätig waren. Das Know-how der KI-Welt und insbesondere der Bildgenerierung wird also weitergetragen. So hat Black Forest Labs auch gleich die Tool-Familie FLUX.1 veröffentlicht, mit FLUX.1 [pro], FLUX.1 [dev] und FLUX.1 [schnell].
Today we release the FLUX.1 suite of models that push the frontiers of text-to-image synthesis. read more at https://t.co/49zTUK8Q5V pic.twitter.com/hmcKRIlizn
— Black Forest Labs (@bfl_ml) August 1, 2024
Diese Tools erlauben es Usern, sehr detailliert und realitätsnah Text mit generativer KI in Bilder umzuwandeln. Bei Aspekten wie der visuellen Qualität, Prompt Following und Co. sollen die Modelle gar die Konkurrenz von DALL-E 3 und Midjourney übertreffen und einen neuen Standard bieten. User können die zwei offenen Modelle über fal.ai und Replicate sowie Hugging Face testen. Das Unternehmen bietet zudem Business-Varianten für Interessierte an. Bald sollen die Modelle noch umfassender verfügbar gemacht werden – und auch ein Text-to-Video-Tool steht in den Startlöchern.
Positives Feedback und Skepsis
In den sozialen Medien gibt es aktuell viel positive Resonanz bezüglich der Fähigkeiten von FLUX.1. Sogar die Generierung von Händen – oft ein Problem bei AI-Bildgenerierungs-Tools – und Schriftzügen funktioniert recht gut.
Gleichzeitig aber stellen sich im Kontext der Nutzung dieses Tools einige wichtige Fragen. Eine davon betrifft die Datengrundlage, die das Training der Modell-Familie herangezogen wurde. Darüber gibt es keine konkreten Details; und so kann man zumindest mutmaßen, dass auch dabei einige Elemente miteinbezogen worden waren, die ohne Zustimmung verwendet wurden. Immerhin lassen sich mit FLUX.1 auch Bilder von bekannten Persönlichkeiten in diversen Kontexten generieren. Und das führt zu einem weiteren Problem: Diese Tools könnten sehr einfach zur Manipulation eingesetzt werden. Das gilt ohnehin für alle Tools im Gen AI-Kontext. Doch durch die äußerst realistische Abbildung von Menschen in imaginierten Kontexten ist FLUX.1 dafür prädestiniert. Für den Bayerischen Rundfunk schreibt Fritz Espenlaub, dass sich „Missbrauch […] kaum verhindern“ lasse. Er konnte sogar ein Bild generieren, auf dem Kamala Harris und Donald Trump einhellig gemeinsam im Podcast-Studio sitzen. Deutsche Politiker:innen ließen sich indes nicht direkt abbilden.
Black Forest Labs stellt einen Gutteil der Tool-Familie als Open Source zur Verfügung und damit können User die Elemente auch lokal verwenden. Das erschwert, so Espenlaub, auch die Überprüfung dessen, was Einzelne damit generieren. Ungeachtet dieser Probleme, mit denen sich das deutsche Unternehmen ebenso auseinandersetzen muss wie OpenAI, Google und Co., ist FLUX.1 derzeit ein vielversprechender neuer Player im Gen AI Game.
Mehr Detailinformationen und Testoptionen findest du auf der Website des Unternehmens.
ChatGPT:
Jetzt kostenlos Bilder mit DALL-E 3 erstellen
© Growtika – Unsplash