Episode 2: Diffusionsbasierte Bildgenerierung

avatar
Steven Cardoso Neumann
avatar
Daniel Henning

Hallo und herzlich willkommen zu Episode 2!

Auch diese Folge beginnen wir mit den Neuigkeiten der letzten Wochen. Wir sprechen über Microsofts Integration von KI-Assistenten in Windows 11, die Einführung von StableStudio durch Stability AI und das neue Produkt reimagine XL von Clipdrop. Außerdem diskutieren wir die mögliche Rückzugsdrohung von OpenAI aus Europa, Nvidias Gewinne im Zuge des KI-Booms und die Forderung der G7 nach technischen Standards für KI. Des Weiteren berichten wir über Sundar Pichais Zusammenarbeit mit der EU beim „KI-Pakt“ und den Fall eines Dozenten, der ChatGPT zur Überprüfung von hausarbeitgenerierten Texten einsetzte, inkl. Tip für euch zur Erkennung von mit KI generierten Texten.

In unserem Hauptthema beschäftigen wir uns mit der KI-basierten Bildgenerierung mithilfe von Diffusion Modellen. Wir erklären zunächst, was ein Diffusion Modell ist und wie es im Vergleich zu anderen Herangehensweisen, wie zum Beispiel GAN, funktioniert. Außerdem werfen wir einen Blick auf bekannte Anbieter und deren Einordnung in der Zeitleiste der Entwicklung der KI-basierten Bildgenerierung.

Ein bedeutender Meilenstein in diesem Bereich war das DALL-E Modell, das zu den ersten großen Durchbrüchen zählt. Wir gehen auf die Funktionsweise von DALL-E ein und diskutieren sowohl seine Vorteile als auch seine Nachteile. Des Weiteren stellen wir das Stable Diffusion Modell vor, das quasi Open Source ist und von der LMU entwickelt wurde, unterstützt durch Stability AI. Ein weiteres interessantes Modell ist Midjourney, über das allerdings nur wenige Informationen bekannt sind.

Wir betrachten die Möglichkeiten und Einsatzgebiete der KI-basierten Bildgenerierung, darunter die Vereinfachung komplexer Prozesse und die Umsetzung visueller Ideen mit weniger Aufwand. Wir werfen einen Blick auf spannende Tools wie Microsoft Designer, das Blender-Plugin „Dream Textures“ und die Funktion „Generative Fill“ in Adobe Photoshop.

Jedoch diskutieren wir auch die Probleme und Gefahren, die mit der KI-basierten Bildgenerierung einhergehen. Dazu gehören die Täuschung von anderen Menschen durch generierte Bilder zu politischen Zwecken sowie die Sorge um den Verlust vieler Kunstformen durch die Masse an generierten Bildern. Wir beleuchten auch die noch ungeklärte Rechtslage in Bezug auf urheberrechtliche Ansprüche von KI-generierten Kunstwerken. Abschließend stellen wir Hilfsmittel vor, wie beispielsweise einen Detektor zur Erkennung von KI-generierten Bildern.

Falls wir etwas vergessen haben sollten, etwas falsches erzählt haben oder ihr uns einfach generell Feedback da lassen wollt dann schreibt uns gerne an hallo@prompt.fm oder kontaktiert einen von uns beiden via den aufgelisteten Möglichkeiten auf https://prompt.fm.

Bis zum nächsten mal, wir freuen uns!

Shownotes

News

Thema


Beitrag veröffentlicht am

von