Ich bin zwar nicht von Anfang an mit dem Internet aufgewachsen, aber es hat trotzdem einen großen Teil meiner Jugend ausgemacht. Seit meinem 12. Lebensjahr besaß ich meinen eigenen PC und Zugriff zum Internet. In den kommenden Jahren fing ich nicht nur an mir das Programmieren selber beizubringen, sondern auch das Internet nach den lustigsten und coolsten Seiten, Anwendungen oder Spielen zu durchsuchen.
Und was soll ich euch sagen? Seitdem habe ich nie mehr damit aufgehört, ständig auf der Suche nach der nächsten coolen Anwendung zu sein, mit der ich mir meine Freizeit versüßen kann.
Die exponentiell ansteigende Entwicklung von KI-Tools, die sich mittlerweile überall im Internet tummeln, ist für mich in dieser Hinsicht natürlich nicht gerade hinderlich. Fast jeden Tag ploppt ein neues KI-Tool auf, welches nicht nur neue Maßstäbe setzt, sondern auch jede Social-Media-Plattform auf den Kopf stellt.
Ständig wird von den neuesten und krassesten Tools berichtet, die dein Leben revolutionieren sollen, aber welche Anwendungen sind wirklich gut? Welche zeigen uns schon mal einen Vorgeschmack auf das, was in naher Zukunft kommen wird und womit kann man eine Menge Spaß haben?
Dafür bin ich heute hier, um euch einmal 3 Tools vorzustellen, mit denen ich unfassbar gerne die aktuellen Möglichkeiten von künstlichen Intelligenzen erforsche. Mit etwas Fantasie lassen sich diese nicht nur bei einem lustigen Abend mit Freunden benutzen, sondern vielleicht auch produktiv einsetzen.
Midjourney
Was kann Midjourney?
Als ich Midjourney zum ersten Mal gefunden hatte, war klar, dass ich an dem Wochenende nichts anderes mehr machen würde, als hiermit herumzuspielen. Midjourney ist eine unfassbar gute KI im Bereich Image-Generation. Ja, richtig gehört. Mit Midjourney könnt ihr euren Text in Bilder verwandeln und das sogar auf einem echt guten Level!
Die KI an sich bedient man mittels eines Discord-Bots. Discord ist ein Onlinedienst für Instant-Messaging, der neben Text, Video und Voice-Kommunikation auch die Möglichkeit bietet, eigene Bots zu programmieren und diese auf eigene Server „einzuladen“. Einen Account kann sich übrigens jeder einfach kostenfrei anlegen.
Ein weiterer Punkt, der euch bestimmt dazu ermutigen wird, direkt loszulegen: Es gibt eine kostenlose Testphase für Midjourney. Während die anderen top-notch KIs alle direkt Geld kosten, könnt ihr euch hier erstmal komplett kostenlos austoben.
Die schieren Möglichkeiten von Midjourney sind so umfassend, dass ich einen ganz eigenen Blogbeitrag nur darüber schreiben könnte. Um euch aber dennoch eine Kostprobe zu liefern, gehen wir mal direkt in medias res.
Wie läuft das Ganze ab?
Wenn alles richtig eingerichtet ist, kann man den KI-Bot direkt mit der ersten Prompt füttern. Von hier an liegt die Qualität der Ergebnisse in euren Händen. Wie kreativ man sein kann und wie ausführlich die Prompt sein muss, um die gewünschten Ergebnisse zu erzielen, ist reine Übungssache mit einer steilen Lernkurve.
Kaum sind die Anforderungen an euer erstes Kunstwerk abgeschickt, generiert der Midjourney-Bot für euch vier Bilder-Varianten, die eurer Prompt entsprungen sind und sich mal mehr, mal weniger voneinander unterscheiden. Von hier an habt ihr jetzt die Möglichkeit, eine der vier Varianten auszuwählen und sie entweder „upscalen“ zu lassen oder als Vorlage für weitere vier Varianten zu benutzen. Beim sogenannten Upscaling wird die ausgewählte Variante nochmal in einer höheren Qualität und Auflösung erzeugt und bildet somit so etwas wie ein „Endergebnis“.
Wie gut sind die generierten Bilder wirklich?
Abschließend noch ein paar Beispiele, die ich mithilfe von Midjourney generieren lassen habe. Ich nenne als Erstes immer die von mir gegebene Anforderung, die sogenannte „Prompt“, zeige dann die vier Varianten, die mir Midjourney zur Auswahl gegeben hat und letztendlich auch eine Version nach dem „Upscaling“ als Endergebnis.
Meine Prompt: „fallout 4 fighter, beautiful fallout 4 landscape in background, wasteland with nuclear mist in the air“
Meine Prompt: „a big beautiful cat in an idyllic forest, light sunset, overall slight pinkish tone through sunset“
Meine Prompt: „big monster fighting against medieval soldier, dark cave with orange and green glowing vines hanging“
FakeYou
Erschreckend authentische Audio-Deepfakes
Neben dem Generieren von Bildern mit Midjourney oder dem Generieren von Text mittels des bekannten ChatGPT, gibt es natürlich noch das Generieren von Ton!
Das nächste KI-Tool, das ich euch vorstellen möchte, generiert neben Audiosequenzen übrigens auch noch Videos.
FakeYou ist eine kostenlose Online-Plattform, die zwei KIs zur Verfügung stellt, welche auf Deepfake-Technologien basieren: Text-To-Speech und Video-Lip-Syncing.
Okay, und was sind Deekfake-Technologien?
Bei Deepfake-Technologien handelt es sich um künstliche Intelligenzen, die in der Lage sind, täuschend echte Audio- und Videoaufnahmen zu erstellen. Diese Technologien können beispielsweise Stimmen oder Gesichter von Personen synthetisieren und diese in anderen, selbst generierten Aufnahmen verwenden.
FakeYou bietet uns gleich zwei solche KI-basierten Tools an, mit denen man nicht nur den ein oder anderen Partygag erstellen kann, sondern wodurch uns auch ganz gut gezeigt wird, wozu Deepfakes in der Lage sind.
„Mama, da kommen komische Stimmen aus meinen Boxen…“
Der Text-To-Speech-Service von FakeYou ermöglicht es Benutzern, aus einer Liste berühmter Personen eine Stimme auszuwählen, die von anderen Nutzern auf Basis von Stimmaufnahmen erstellt wurde. Neben Berühmtheiten, wie dem Rapper 50 Cent und Homer Simpson, gibt es hier auch deutsche Stimmen, wie zum Beispiel die von Angela Merkel, zur Auswahl.
Sobald eine Stimme ausgewählt wurde, sieht man eine Bewertung der Stimmen- bzw. Text-To-Speech-Qualität, die auf dem Rating anderer Nutzer basiert. Da diese Stimmen von jedem normalen Nutzer erstellt werden können, kann nicht garantiert werden, dass jede Stimme einwandfrei funktioniert. Beachtet daher das schlaue Bewertungssystem, bevor ihr eure Zeit vergeudet.
Mit der Funktion „Text-To-Speech“ lässt sich ein selbstgeschriebener Text spielend einfach von einer ausgewählten Stimme vorlesen. Sobald man den Text eingegeben hat und auf „Sprechen“ klickt, hört man kurz darauf bereits die ausgewählte Person, die eigenen Worte sprechen. Durch den Einsatz von künstlicher Intelligenz klingt das ganze sogar teilweise erschreckend echt.
Wie FakeYou Audio und Video verbindet
Bei dem zweiten KI-Tool von FakeYou handelt es sich um sogenanntes Video-Lip-Syncing, bei dem ihr auch wieder eine berühmte Person auswählen und diesmal zusätzlich noch eine eigene Audioaufnahme hochladen könnt. Daraufhin werden die Lippenbewegungen der Person automatisch so animiert, als ob sie das in der Audiodatei Gesagte tatsächlich aussprechen würde. Dabei ist es egal, ob ihr selbst in der Audioaufnahme sprecht oder zum Beispiel einfach den Fernseher abgefilmt habt.
Durch dieses Tool könnte Bill Gates also in eurer Stimme eure Einkaufsliste vorlesen.
Fusion! Text-To-Speech & Lip-Syncing
Wenn man das Ganze aber auf die Spitze treiben möchte, macht man Folgendes: Man lässt von der FakeYou TTS-KI eine Sprachsequenz einer berühmten Person erstellen. Um hier mal in dem Beispiel vom Microsoft Gründer zu bleiben, wählt ihr also Gates aus und lasst ihn das sprechen, was ihr wollt. Danach wechselt ihr zum Video-Lip-Syncing, wählt das Bild von Gates aus, ladet die Audiodatei von seiner eigenen, gefakten Stimme hoch und Bäm! Ein Video von Bill Gates, wie er mit der Stimme von Bill Gates Sachen sagt, die Bill Gates eigentlich nie gesagt hat.
Dass das Ganze teilweise echt noch sehr komisch und offensichtlich fake aussieht, muss ich euch bestimmt nicht sagen. Es zeigt aber schon mal, was die Zukunft bringen wird.
FakeYou ist ein wahnsinnig lustiges Tool ist, mit dem man selber mal ein bisschen kreativ werden und vielleicht seine Freunde mit einer personalisierten Audio-Aufnahme von Otto Waalkes oder Bernd das Brot überraschen kann.
AI Dungeon
KI als Entertainment
Bei den beiden vorangegangenen KI-Tools haben wir kreative Möglichkeiten gehabt, um für unser oder das Entertainment anderer zu sorgen. Bei diesem Tool lehnen wir uns jetzt mal etwas zurück und lassen uns von der KI bespaßen!
Bei „AI Dungeon“ handelt es sich um ein unendliches Text-Adventure mit endlosen Möglichkeiten und klarem Wiederspielwert.
Wie ein Buch, bloß interaktiver
Text-Adventures sind interaktive Geschichten, die in der Regel aus einer Abfolge von Textbeschreibungen und Menüs bestehen, mit denen der Spieler die Handlung vorantreibt und erleben kann. Normalerweise muss der Spieler Aktionen durch Schreibbefehle ausführen. Dabei gibt es die Unterscheidung zwischen dem, was man in der Story tut (DO), was der Spieler sieht (SEE) und was man sagt (SAY). Das Text-Adventure antwortet dann auf die Handlung des Spielers oder tritt an die Stelle der Sinne und erläutert, was der Spieler sieht, hört oder vielleicht sogar riecht.
Limitationen & wie die KI Abhilfe schafft
In der Natur solcher Spiele liegt es, dass sie Grenzen haben, da ein vorher programmiertes, textbasiertes Spiel nicht jede Handlung eines Spielers oder jeden Ort, den der Spieler besuchen will, abdecken kann. Es handelt sich also oft um einen eingeschränkten Handlungsstrang. Auch hier kommt mal wieder auf wundersame Art und Weise die KI ins Spiel und hebt diese Einschränkungen auf.
AI Dungeon ermöglicht es dem Spieler, so ziemlich alles zu tun, was er möchte, während die KI die Geschichte und Ereignisse einfach „weiter generiert“. Es gibt keine vorgesehene Handlung, weil die KI auf alles individuell reagiert, was der Spieler machen, sagen oder sehen möchte.
Deswegen ist ein weiteres Merkmal von AI Dungeon auch die Tatsache, dass die Geschichte unendlich lange weitergehen kann, ohne dass es ein definiertes Ende gibt.
In diese Welten könnt ihr eintauchen
In den spielbaren Welten von AI Dungeon gibt es eine gute Auswahl an Settings, aus denen man wählen kann, wie z.B. „Zombie-Apokalypse“, „Cyberpunk“, „Fantasy“ und viele weitere. Darüber hinaus gibt es aber auch vorgefertigte, spezifischere Szenarien zur Auswahl, um ein reichhaltiges Spielerlebnis zu bekommen.
Und das alles sogar kostenlos!
Ein großer Faktor, der mich eigentlich bei jedem dieser drei KI-Tools reizt, ist der Fakt, dass es immer eine vollständig kostenlose Variante gibt. So eben auch im Fall von AI Dungeon. Wenn man jedoch noch mehr coole Features in seinem Abenteuer haben möchte, gibt es auch eine Bezahlvariante, die noch mehr Funktionen bietet. Eine dieser Funktionen ist beispielsweise eine Image-Generation KI, die Bilder von dem generiert, was man um sich herum sieht, um das Spiel noch immersiver zu machen.
Zusammenfassend lässt sich sagen, dass AI Dungeon für euch ein einzigartiges Spielerlebnis bietet, das es so in der Welt der Text-Adventures noch nicht gab. Es gibt dem Spieler die Freiheit, so ziemlich alles zu tun, was er möchte, während die KI die Handlung vorantreibt. Warum nicht einfach mal ausprobieren und sich dabei die Zeit vertreiben?
Fragen oder weiterer Austausch?
So, das waren drei coole KI-Tools, mit denen ich immer noch regelmäßig meinen Spaß habe. Ich glaube, es ist mir auch gelungen, einen bunten Querschnitt an Tools zu präsentieren, sodass für jeden etwas dabei ist.
Wenn ihr noch konkrete Fragen, Ideen oder sogar andere Tools habt, über die ihr euch austauschen wollt, kontaktiert mich gerne oder lasst einen Kommentar da.
Gerne auch, wenn es euch eher um künstliche Intelligenzen und Produktivität geht. Das Thema wird bei uns im Team auch gerade sehr heiß diskutiert!
Dieser Blogbeitrag enthält Bilder von catalyststuff und starline auf Freepik.