Magazin INNOVATION KI
  • Jason M. Schmitt
  • 06.07.2023

Midjourney 5.2: Kleine Änderungen und trotzdem alles neu?

Der KI-Kampf zwischen Midjourney und Adobe ist entflammt und beglückt User:innen fast jeden Monat mit neuen innovativen Tools. Kann das neue Midjourney 5.2 sich nun selbst die Krone aufsetzen?

Wer in redaktionellen Prozessen dieser Tage realistische Bilder braucht, kommt an Midjourney nicht vorbei. Der Papst in stylischer Moncler Jacke, oder Trump im Faustkampf mit der Polizei, jeder hat die Bilder gesehen – dass sie nicht echt waren, wird viele überrascht haben. So gut ist die KI inzwischen.

Willst jemand ein Bild seines Wohnzimmers im Stile des Malers Van Gogh Stil haben, kann man das Programm einfach mit einem Foto des Raumes füttern. Es dauert dann noch eine gute Minute bis zu einem fertigen Ergebnis. Alle bekannten Künstler:innen und Stils können durch Midjourney imitiert werden. KI-Da Vinci könnte uns also auch Skizzen von den Muppets anfertigen, also falls wir das wollten.

Seitdem Adobe mit einer eigenen KI für Photoshop und dem Programm „Firefly“ die Vormachtstellung von Midjourney bedroht, arbeiten die Entwickler:innen auf Hochtouren an neuen Innovationen. Zu sehen sind die Ergebnisse dessen nun an Midjourneys neuster Version 5.2.

Midjourney 5.2 vergrößert deine Leinwand!

Manchmal bekommt man Bilder ausgegeben, die man gerne erweitert hätte. Mit einem einfachen Klick kann man jetzt aus dem Bild herauszoomen, die KI gestaltet rund um das Originalbild nun eine realistische Umgebung. 

Nehmen wir einmal an, wir haben einen Ritter auf einem Ross erstellt. Jetzt kann man die Szenerie erweitern und ein, sagen wir, Schlachtfeld zeigen. Von dort kann man weiter herauszoomen auf einen Berg, auf dem sich die Bogenschützen in Stellung bringen. Man zoomt heraus und sieht Dr. Who, der dahinter aus seiner Zeitmaschine steigt.

All das geht. Und all das klingt in der Theorie bereits super. In der Praxis ist es aber immer noch sehr mit viel Trial-and-Error verbunden.

Diesen Prozess kann man endlos wiederholen und entweder in nur leichter Form (1,5x) oder stark (2x) ausführen. Diese Bilder kann man in Schnittprogrammen dann so verschmelzen lassen, dass sie filmisch, nahtlos ineinander übergehen.

Dieses Feature ist besonders gut, um mehrere Figuren gleichzeitig darzustellen. Gibt man „Elon Musk and Mark Zuckerberg fighting in a ring“ an, generiert die KI oft nur einen der zwei Personen oder lässt diese verschmelzen. Diese Mischung will wohl keiner sehen, drum kann man dies mit einem Zoom umgehen. Nutzt man die Funktion, kann man jedes Mal erneut angeben, was denn im erweiterten Bild alles zusätzlich zu sehen sein soll. Hier könnt ihr jetzt Mark Zuckerberg nennen und er wird dargestellt.

Was ändert sich noch mit Midjourney 5.2?

Das größte Problem von Midjourney war seit jeher der geringe Einfluss der Nutzer auf die Ergebnisse. Klar, man gab eine Anweisung, aber wie genau diese umgesetzt wurde, bestimmte das Programm selbst. Mit dem Parameter „—stylize“ oder auch „—s“ kann man von einer Skala von 0-1000 nun die künstlerischen Freiheiten der KI bestimmen.

Beim Nullwert arbeitet Midjourney stumpf und trocken die Anweisung ab und bei einem Wert von 100 (der voreingestellt ist), bekommt man die typisch-kreativen Ergebnisse, die man gewohnt ist. Bei allem darüber hinaus verselbstständigt die KI sich förmlich.

Generell, geht laut Angaben der Entwickler, Midjourney jetzt intensiver auf „—style“ Anweisungen ein. Legt man also z.B. „Raw“ als Stil fest, dann bekommt man nur realistische Bilder, wie die vom Streetwear Papst, scheinbar bloß besser.

Auch im Nachhinein bietet Midjourney 5.2 jetzt mehr Bearbeitungsmöglichkeiten. Wenn dir bestimmte Details im Bild nicht gefallen, kannst du, je nachdem wie groß die Änderungen sein sollen, „Vary (Subtle)“ oder „Vary (Strong)“ auswählen. Bei beiden Optionen kann man die Anweisung für das Bild auch nochmal ändern.

Hat euer Indiana Jones nicht die Peitsche in der Hand, dann drückt also auf „Vary (Subtle)“ und fügt diese der Anweisung hinzu. Hat er auch seine Lederjacke und Hut nicht auf, dann müsst ihr auf die starken Änderungen zurückgreifen.

Ähnlich wie die „Vary“ Optionen, gibt es jetzt auch einen „Remaster“ Knopf, welcher ein Bild in mehrere verschiedenen Stile mischt. Indiana Jones wird dann als Cartoon, als Fee, als Van Gogh Gemälde und als Roboter dargestellt.

Auch mit allen Neuerungen hockt man immer mal wieder frustriert vorm Rechner und gibt neue Anweisungen, weil das gewünschte Bild nicht herauskommt. Die Dauer dieser Tortur ist nun aber im Durchschnitt deutlich niedriger als zuvor. Die Krone kann sich Midjourney, besonders im Hinblick, dass Adobe auch bereits an allen diesen Features tüftelt, noch lange nicht aufsetzen.

Wir, von robotspaceship, beobachten die Entwicklungen ganz genau und halten euch auf dem Laufenden. Wenn ihr zukünftig keine solchen Entwicklungen und Neuigkeiten verpassen wollt, dann könnt ihr euch über diesen Link für unseren kostenlosen Newsletter registrieren:

"KI-Expedition"

ChatGPT? Midjourney? Künstliche Intelligenz? An generativer KI kommt momentan niemand vorbei – und das wird so bleiben! Aber wie genau sich diese Tools ganz konkret für die eigenen Herausforderungen nutzen lassen, ist meisten noch unklar.

Geh mit deinem Team und unserer Crew auf „KI-Expedition“: In unserem neusten Format lernt ihr die Basics, testet verschiedene Tools und entwickelt Strategien plus ganz konkrete Use Cases für euch.

JETZT TEILEN:
Noch Fragen?
Wir sind für euch da!
Oliver Kemmann
|
CEO

KEMWEB wird robotspaceship!

Unleashing the power of Innovation