Die KI der nächsten Generation kommt in Photoshop an

Es sind erst wenige Monate vergangen, seit wir über die Einführung der generativen KI in Photoshop in ihrer ersten endgültigen Form (d. h. nach Abschluss der Beta-Phase) gesprochen haben, die mit Version 25.0 des Programms erfolgte. Dennoch ist es jetzt schon an der Zeit, darüber zu reden erstes großes Update des AI-Paketsmit der Veröffentlichung in der Beta-Phase verfügbar gemacht Photoshop V25.8.

Worum geht es? Im Wesentlichen von höhere Qualität der erzeugten Bilder z größere Kontrolle auf sie, vor allem danke an Möglichkeit der Verwendung von Referenzbildern um die KI besser zu steuern. Allerdings sind die praktischen Vorteile von Bessere Integration in die Photoshop-Oberflächemit der Möglichkeit, diese Funktion erstmals zu nutzen vom Text zum Bild (Bildgenerierung per Texteingabe) direkt im Programm.

Bevor wir uns jedoch näher mit den neuen Funktionen befassen, lohnt es sich, auf einige Einschränkungen aufmerksam zu machen, die Adobe seit Anfang des Jahres (17. Januar 2024) eingeführt hat.

Die Generierung von Bildern dank KI ist bekanntlich rechentechnisch (also energetisch) aufwendig und wird nicht mehr wahllos einsetzbar sein. Adobe hat zu diesem Zweck das sogenannte eingeführt Generative CreditsWährung, die für die Erstellung KI-basierter Inhalte ausgegeben werden kann.

beb5951956.jpg

Diese Guthaben werden monatlich erneuert (ohne die Möglichkeit, ungenutzte Guthaben anzusammeln). Die Anzahlung richtet sich nach der Art des Abonnements Beispielsweise ist der 1-TB-Fotoplan 500 monatliche Credits wert, während die Lightroom Cloud-App allein 100 wert ist. Es gibt auch Fälle, wie den des 20-GB-Fotoplans, bei dem die Höhe der Credits vom Abonnement abhängt Datum . Spezifische Informationen für Ihren Fall finden Sie auf der speziellen Adobe-Website.

Unabhängig von der Höhe der monatlich verfügbaren Generierungsguthaben, Jede Aktion kostet normalerweise 1 Credit. Zum Beispiel in Bezug auf Photoshop, die Funktionen Bild generieren, Hintergrund generieren, Ähnliches generieren, Generative Füllung, Generative Erweiterung Und Referenzbild Sie kosten alle 1 Credit.

Auch in diesem Fall finden Sie auf der entsprechenden Seite detaillierte Informationen, die sich im Laufe der Zeit sicherlich weiterentwickeln werden. Zum Zeitpunkt des Verfassens dieses Artikels sind Adobe Express-Texteffekte beispielsweise immer noch kostenlos, werden aber andere Kosten als Null haben. noch unbekannt) ab dem 1. Juli 2024.

c9f06b3919.jpg

b0685b5e1a.jpg
Ein erstes Beispiel für den Einsatz generativer KI zum Einfügen nicht vorhandener Elemente. Auf den ersten Blick ist das Ergebnis hervorragend, eine genauere Analyse offenbart jedoch in der Regel immer das Vorhandensein mehr oder weniger gravierender Artefakte.

Einige werden diese Einschränkung wahrscheinlich als Belästigung empfinden, aber auf persönlicher Ebene sind wir dafür. Es wäre ziemlich heuchlerisch, über Nachhaltigkeit zu sprechen und unnachgiebige Positionen einzunehmen (auf Kosten anderer) und gleichzeitig KWh zu verbrauchen, um Frivolitäten zu erzeugen, die man in den sozialen Medien posten kann

Nachdem dies alles gesagt ist, ist es an der Zeit, die technischen Neuerungen zu beleuchten.

ca20e1a873.jpg

Wir erinnern Sie daran: Wenn Sie die neuen Funktionen von Firefly 3 aus erster Hand erleben möchten, können Sie dies direkt online auf der Adobe Firefly-Website tun. Wenn Sie die neuen Funktionen von Photoshop genauer testen möchten, können Sie die Betaversion installieren App beginnend mit Creative Cloud Desktop (auch im Testzeitraum von 30 Tagen), wählen Sie „Apps“ in der linken Spalte, dann „Beta“ in der horizontalen Leiste und schließlich „Photoshop (Beta)“. Beta-Anwendungen können mit jeder bereits installierten stabilen Version koexistieren.

In Photoshop betrifft die eigentliche, große Neuigkeit das Bilderzeugung Ausgehend von einer Texteingabeaufforderung, die nun erwartungsgemäß von einem speziellen Tool und einer kleinen dedizierten Schnittstelle profitiert. Das bedeutet, dass es möglich ist, alles bequemer zu erledigen, Auch in Photoshop.

8d40320571.jpg
Für die Nutzung von KI-Funktionen ist die Kontextleiste von grundlegender Bedeutung. Wenn es nicht vorhanden ist, kann es durch Auswahl von „Kontextbezogene Taskleiste“ im Menü „Fenster“ aufgerufen werden.

Es besteht die Möglichkeit, künstlerische Inhalte zu generieren, zum Beispiel ein Gemälde oder ein fotorealistisches Bild, und es ist möglich, die KI durch Angabe eines Stils, eines Themas (Comics, Pop-Art, Graffiti), einer Technik ( Acryl, Öl auf Leinwand, Hell-Dunkel), Effekte (Weitwinkelfotografie), Materialien oder abstrakte Konzepte (futuristisch, nostalgisch, kitschig).

2ce93b46fe.jpg

Das Ergebnis wird immer ein Trio von Vorschlägen sein, aus denen Sie wählen können, und zwar jetzt Die Funktion wird hinzugefügt Ähnliches generierenanwendbar auf einen der drei Vorschläge, sehr nützlich, um die KI auf das gewünschte Ergebnis auszurichten.

In diesem Sinne ist es sinnvoll zu unterstreichen, wie Die Eingabeaufforderung, die das Bild generiert hat, bleibt verfügbar und kann daher bequem geändert/verfeinert werden bevor Sie die Taste erneut drücken Erzeugt. Sie können beispielsweise von „Vase mit Blumen“ über „Vase mit 3 Blumen“ zu „Vase mit 3 roten Blumen“ wechseln. Offensichtlich wird der Nutzen dieser Funktion bei komplexen Eingabeaufforderungen stärker geschätzt.

Absichtlich, die Textaufforderung möglicherweise komplexer als zuvor, und ist besser interpretiert. Zum Beispiel:

Fotografisches Porträt einer kaukasischen Frau. Die Frau sollte lange rote Haare und grüne Augen haben. Es verwendet ein Rembrandt-Lichtmuster, um das Motiv zu beleuchten.

7d58093dec.jpg

Es lieferte eine Reihe von Ergebnissen, von denen wir oben drei Beispiele zeigen, die alle ganz den Anforderungen entsprachen (mit Ausnahme des Beleuchtungsschemas, das offensichtlich noch immer über den Fähigkeiten der KI liegt). Die fotografische Qualität sicherlich gewachsen, wenn auch nicht besonders lichttechnisch, und das zweifellos eine der Stärken der Adobe-Lösung.

Vieles hängt weiterhin davon abund es kann in Zukunft nicht anders sein, durch die Verfügbarkeit von Bildern, die der Anfrage ähneln, in der Adobe Stock-Bibliothek, auf die die KI zurückgreifen kann. Sollte nichts dabei sein, was wirklich zur Anfrage passt, versucht die Software, ein möglichst ähnliches Bild zu finden, das allerdings natürlich sehr weit vom gewünschten Ergebnis entfernt sein kann. Und das ist aller Wahrscheinlichkeit nach die größte Schwäche von Firefly.

5a6a08b55e.jpg

f5c704465d.jpg

Oben: Beta-Ergebnis von Adobe Photoshop. Unten: Bing Image Generator-Ergebnis für dieselbe Eingabeaufforderung, bei der eine Frau in einem roten Abendkleid angefragt wurde, die durch die (nassen) Straßen von Tokio spaziert.

Die Adobe Sock-Bibliothek ist zwar umfangreich, aber nicht unendlich, und das ist auch unser Eindruck andere Lösungen Wir haben einfach versucht, dem Bing Image Generator dieselben Eingabeaufforderungen zuzuführen, die auf viel größere Bibliotheken zurückgreifen und daher dazu in der Lage sind ein Ergebnis liefern, das im Durchschnitt näher an den Erwartungen des ersten Versuchs liegt.

Die Möglichkeit, ein Referenzbild zu verwenden, ist im Allgemeinen eine große Hilfe bei der richtigen Ausrichtung der Software. Zum Beispiel die Eingabeaufforderung:

Feld mit roten Mohnblumen. Mohnblumen im Vordergrund, grünes Gras im Hintergrund, untergehende Sonne.

ed61c9009d.jpg

Zunächst wurden die drei oben genannten Beispiele generiert, die im Übrigen alle zufriedenstellend sind. Durch das Laden eines Beispielbilds lieferte die KI jedoch ein sehr ähnliches Ergebnis, ohne dass Anweisungen hinzugefügt werden mussten, was in diesem speziellen Fall der Fall gewesen wäre um sehr konkret zu sein.

213900395e.jpg
Links: Referenzbild. Rechts: Erzeugtes Bild.

Das Referenzbild, mit anderen Worten, eliminiert oder reduziert die Notwendigkeit, komplexe Eingabeaufforderungen zu schreiben in einer Trial-and-Error-Sequenz, die sich in vielen Fällen auch als ziemlich langwierig und mühsam erweisen kann.

Das Referenzbild kann auch zum selektiven Ersetzen verwendet werdenwodurch die bereits verfügbaren generativen Füllfunktionen verbessert oder effizienter gemacht werden.
In diesem Zusammenhang dient das Beispielbild als „Inspiration“ für die KI, typischerweise um ein in der Szene vorhandenes Objekt durch ein anderes Objekt zu ersetzen.

983b3b7e95.jpg

517bb5b43f.jpg

3a065b3a51.jpg

Drei Beispiele für selektives Ersetzen, „inspiriert“ durch ein Referenzbild (sichtbar im Kontextmenü jedes Bildschirms). Sehr unterschiedliche Ergebnisse. Oben: Bedienung nicht perfekt, aber ausreichend, um den oberflächlichen Blick zu bestehen. In der Mitte: eindeutig unnatürliches Ergebnis, würde die Verwendung von Textaufforderungen erfordern. Unten: Die Anfrage, eine Leica-Kamera durch eine Panasonic zu ersetzen, ergab (unter anderem) diese beiden Ergebnisse. Die von Adobe nachgebaute Kamera ist absolut unrealistisch, ähnelt aber zumindest einer echten Kamera; Wie es der KI gelungen ist, das Bild eines Eisbärenjungen einzufügen, ist ein tiefes Rätsel …

Allerdings ist es schwierig, perfekte oder auch nur plausible Ergebnisse zu erzielen, wenn das betreffende Bild fotorealistisch sein muss. An dieser Front müssen sicherlich noch viele Schritte unternommen werden

Bei abstrakten Bildern, Zeichnungen, Comics und Inhalten, die sich in der Regel nicht mit der Realität auseinandersetzen müssen, ist offensichtlich alles viel einfacher und überzeugender.

Das neue Feature ist dennoch erwähnenswert Details verbessern, wodurch die Auflösung des eingefügten Objekts hochskaliert wird, um es besser in hochauflösende Quellbilder einzufügen. Die Funktion wird durch Klicken auf das entsprechende Symbol in der oberen linken Ecke der Miniaturansicht (eines der drei vorgeschlagenen) aktiviert und ermöglicht keine Anpassungen.

42d16690fa.jpg

Im Übrigen gelten weiterhin die für die Debütversion 25.0 geäußerten Bewertungen, die wir so zusammenfassen können. Generative Füllfunktionen sind bereits recht ausgereift und liefern insbesondere beim Löschen (Entfernen unerwünschter Objekte, Entfernen des Hintergrunds) hervorragende Ergebnisse.

Sie leisten im Allgemeinen auch dann gute Arbeit, wenn es darum geht, die Szene durch das „Erfinden“ nicht existierender Teile zu erweitern, solange die betreffende Szene keine präzise Geometrie enthält (wodurch die Unvollkommenheiten offensichtlich deutlicher werden).

4b55ac690c.jpg

Eines der häufigen unerklärlichen Ergebnisse, die Sie mit der Funktion „Hintergrundersetzung“ erhalten. Hervorragender Umriss, aber warum wurde diese Art von Gewölbe, das rechts sichtbar ist, erstellt, als man nach einem neutralen Hintergrund fragte?

Das Einfügen/Ersetzen von Objekten muss jedoch noch erheblich verbessert werden. Nicht, dass es unter besonders günstigen Umständen unmöglich wäre, auch in diesem Bereich gute Ergebnisse zu erzielen, aber die meisten Einsätze werden weder realistisch noch plausibel erscheinen.

Letztendlich können wir sagen, dass die generative Plattform von Adobe bereits sechs Monate nach ihrem Debüt oder etwas länger wichtige Fortschritte gemacht hat, und zwar jetzt besser integriert und ermöglicht einen natürlicheren Dialog mit der KI, sowohl weil es komplexere Eingabeaufforderungen akzeptiert und besser interpretiert, als auch (vor allem) wegen der Verwendung des „Referenz“-Bildes. , also in Bezug auf Benutzerfreundlichkeit dass die größten Fortschritte zu verzeichnen sind.

5d1b6d9c1b.jpg
Von Bing generiertes Gesicht (links) im Vergleich zu von Adobe generiertem Gesicht (rechts). Der bemerkenswerte Unterschied.

Die Qualität der erzeugten fotorealistischen Bilder (gemeint sind hier vor allem menschliche Gesichter) ist deutlich gestiegen und liegt an der Spitze der Kategorie.

Die Achillesferse könnte die Grundlage für Referenzbilder sein. Wie bereits gesagt, das hatten wir tatsächlich das Gefühl, dass andere generative Werkzeuge bei denselben Anregungen Bilder erzeugten, die den Erwartungen vom ersten Versuch besser entsprachen, vielleicht dank der breiteren verwendeten Referenzbasis. Andererseits bietet die Adobe-Plattform mit ihrer „geschlossenen“ Adobe Sock-Basis das Maximum an Garantien in Bezug auf Rechtmäßigkeit, Korrektheit und Achtung des Urheberrechts, ein für Fachleute nicht zu unterschätzender Aspekt.

PREV Sie werden schockiert sein, wenn Sie feststellen, dass diese Geste Ihrem Smartphone nur „Schaden“ zufügt: Tun Sie es nicht noch einmal
NEXT Supereruption von der Sonne, ist die stärkste im aktuellen Zyklus – Letzte Stunde