Maniac Race – Eine KI Case Study über die Zukunft der Content Produktion
Deep Dive in 5 Minuten
Was passiert, wenn man 90er-Spielzeugwerbung wie von Mattel, Hasbro, Sega oder Nintendo mit generativer KI eskalieren lässt?
🎶 PRO-TIP: Original Soundtrack beim Lesen hören
Die Idee zu MANIAC RACE war einfach: ein fiktives Videospiel erschaffen, das sich anfühlt, als hätte es Ende der 90er existieren können — irgendwo zwischen Saturday-Morning-Cartoons und der Müslischale — in einer Welt, in der Werbung noch laut und schrill war und KPI aus Einschaltquoten und Ladenverkäufen bestanden.
Entstanden ist ein retro-phantastischer Werbewahnsinn: überladene Rennstrecken, durchgeknallte Figuren und ein Sprecher, der klingt, als hätte man ihm drei Dosen Energy Drink und ein Mikrofon gegeben.
In diesem Behind-the-Scenes ziehe ich den Vorhang hoch: Ich zeige dir meine exakten Power-Prompts, den Workflow hinter den Animationen und warum das Ergebnis ebenso faszinierend wie beängstigend ist.
Also schnall dich an!
Die Ausgangsfrage
Ich wollte wissen: Können KI-Tools die Seele und den Trash der 90er-Jahre einfangen? Und kann ich meine Vision im Kopf durch die KI in ein Video verwandeln, das meine Handschrift trägt?
Das Ergebnis hat selbst mich überrascht.
Von der Idee zum visuellen Konzept
Am Anfang stand kein Prompt nach Trick 17, sondern ein relativ klares Bild:
- ein fiktives Arcade-Racing-Game
- überzeichnete Charaktere
- absurde Fahrzeuge
- ein Vibe irgendwo zwischen Toy Commercial, Cartoon und Sci-Fi

No Slob! Vision & Konzept
Bevor überhaupt animiert wurde, brauchte es zunächst visuelle Konsistenz: Charaktere, Fahrzeuge, Props und die Welt mussten designt werden.
Einzelne gute Bilder zu erzeugen ist relativ einfach. Wiedererkennbare Figuren über mehrere Einstellungen hinweg zu halten, deutlich schwieriger.
Die Lösung: Referenzbilder, Character Sheets und klare Workflows.

Tools & Workflows
Viel Frust und Credit Burns haben dazu geführt, meine KI Aggregatoren und Modelle der Wahl zu finden. Allerdings kann sich mein Toolset bei dem aktuellen Tempo auch schnell wieder ändern.
Unter anderem kam zum Einsatz:
Nano Banana Pro, Photoshop
- Bildgenerierung
- Editing
- Montage
- Upscaling
Kling, Seadream, Runway, Cinematic Studio
- Video-Generierung
SUNO, ElevenLabs
- Musik
- SFX Assets
- Voice Design
Adobe After Effects, Audition
- Schnitt
- Compositing
- Post-Effekte
Wie in einer traditionellen Produktion entsteht das Ergebnis nicht durch eine 0815 Schablone, sondern durch viele individuelle Entscheidungen.
Gerade dieser Teil wird oft unterschätzt:
Nicht die Generierung kostet am meisten Zeit, sondern Auswahl, Korrektur und Iteration.

Prompting ist nur ein Teil der Gleichung
Viele Außenstehende stellen sich KI-Projekte oft so vor, als würde man einen Satz eingeben und direkt ein fertiges Ergebnis bekommen.
Da habe ich ganz andere Erfahrungen gemacht. Nur um ein Key-Visual genau zu treffen, braucht es teilweise überraschend viele Versuche, bis es exakt den Ton trifft, den man im Kopf hatte. Und da sprechen wir noch nicht vom ganzen Film.
Was aber hilft, sind…
Reference-Sheets
Der Workflow ist im Prinzip einfach. Du brauchst ein Full-Body Portrait und ein Close-Up. Aber wenn du etwas Anspruch hast, brauchst du zudem Geduld und Ausdauer.
- Erstelle einen Charakter (Prompts s. u.)
- Bearbeite den Charakter, evtl. remixe ihn
- Wiederhole Schritte Eins und Zwei 3 – 7 Mal, bis du es fühlst
- Erstelle ein Close-Up

Für Cyborg Patrick habe ich zuerst den Seestern als Real-World 3D Rendering vorbereitet. Diesen dann zusammen mit einem Borg Filmgrab aus dem Internet als Image References geladen und einen klar strukturierten, möglichst einfachen Prompt verfasst.
Image Prompt Teil 1 beschreibt das „Was“:
- Design the Seastar character Patrick as a „Borg“ cyborg creature (like from Star Trek).
Image Prompt Teil 2 sorgt für ein sauberes Ergebnis fürs Reference Sheet:
- Full body portrait, isolated on neutral off-white background.
Dasselbe Prompt-Prinzip kann in etwa auch auf Props (Gegenstände, Fahrzeuge) und Welten (Szenenbilder) übertragen werden.
Wichtig ist einfach, dass du alle 3 Elemente für deine weitere Szenengestaltung zur Hand hast: Charaktere, Props, Worlds.

Der Weg:
- Assets bauen (Reference Sheets)
- Szenenbilder (Worlds) für Startframes zur Video Generierung vorbereiten
- Für präzise Animationen zusätzlich auch das Endframe vorbereiten
- Und ab damit ins Video Model, dort dann wieder sorgfältig Prompten
Wie die Bilder Laufen lernen (auf Pro-Level)
Beim Packshot ist es besonders wichtig, Glitches, Flickering und Halluzinationen zu vermeiden. Marken und Agenturen schauen genau auf die Konsistenz und Wiedererkennbarkeit, um das Vertrauen ihrer Zielgruppen nicht zu gefährden.
Darum habe ich Start- und Endframe besonders sorgfältig behandelt. Vor allem der Endframe bekam eine Photoshop Retusche-Sonderbehandlung. Hier konnte ich gleich dafür sorgen, dass der Packshot sauber ist und auch den Hintergrund abdunkeln, der in der Animation sowieso gedämmt werden sollte.

Prompt für die Video-Animation:
Packshot (mit Start- und Endframe)
- The happy kids present the toys. The girl then pushes the video game box right close to camera lens, with a focus shift tracking the video game box, simultaneously the scene darkens a bit, but the video game box stays nicely lit.
Im Prompt steht wirklich nur das, was passieren soll. Schreibe es hin! Auch wenn du deine Start- und End-Frames gründlich vorbereitet hast. Denn dann ist die Chance hoch, dass sich das Videomodell nicht zusätzliche Halluzinationen ausmalt, die du gar nicht haben willst.
Der Ton macht den halben Film
Den Spruch hat jeder, gefühlt, seit der Steinzeit schon mal gehört. Stimmt aber auch. Und ein exzellenter Sound hilft auch über schwächere Shots hinweg.
Soundtrack mit KI
Die Musik habe ich in SUNO gemacht. Wer SUNO kennt, weiß wie unberechenbar und random die Gens manchmal sind. Ich habe bestimmt 34 Generationen und unzählige Prompttechniken versucht, bis der Soundtrack dem in meinem Kopf entsprach.
Ich bin in zwei Schritten vorgegangen:
- Instrumental
- Prompt:
metal, High-BPM techno pulse with sidechained bass, filtered risers, and glitchy SFX; tense ostinato strings weaving with staccato brass hits, Guitars enter as tight, palm-muted chugs that swell into soaring harmonized leads for the final third, Energy arc: stealthy mechanical build → breathless midsection with polymetric percussion → explosive, double-time climax and abrupt stinger ending, soundtrack, rhythmic, beats, techno
- Prompt:
- Vocals
- Lyrics:
Go go go
oh go go go
yeah go yep go
yep go go go
- Lyrics:
Ja, ich wusste eben, was ich wollte 😆
Voice Over Design mit KI
Den Sprecher habe ich in ElvenLabs designt und generiert. Auch hier ein paar Trial-and-Errors. Aber ehrlich, die K.I versteht schon irre gut, was man im Kopf hat, wenn man es präzise und einfach beschreiben kann. Besonders „tief“ ist die Stimmen-Generation nicht mal heraus gekommen, die ich letztendlich gewählt habe. Aber der Vibe war einfach zu gut. Und so war Matthias Mattell geboren.

- Voice Prompt:
Eine reißerische 90er Jahre Werbestimme, männlich, prägnant, tief, laut, schnell, penetrant, sensationell, phänomenal.
Die Keywords penetrant, sensationell, phänomenal machten den Unterschied.
Sound Design & Mix
Tatsächlich lag das Soundbett schon als Layout fürs Video Editing vor, das ich wegen der vielen Post-Effekte und Speed-Ramps übrigens in After Effects und nicht in Premiere gemacht habe. Video und Audio Edit fanden parallel statt.

Voice Over und Musik haben jeweils ihren eigenen reservierten Channel, während sich die Atmos, Foleys und Effekte über 7 weitere Ebenen verteilen.
Vorsicht vor Übertreibung! Jeder Klang hat seinen Sinn und ist dafür da, das Gesamtbild komplett zu machen. Die Musik trägt den Sprecher und treibt die Dynamik an, Atmos und Effekte highlighten die Action. Frequenzüberlagerungen vermeiden. Der Mix braucht genügend Raum, damit alles hörbar bleibt und nichts übersteuert.
Abschließende Gedanken
Mein Fazit aus diesem Projekt und 3 Jahren Content Produktion mit KI
Künstliche Intelligenz kommt einem ganz schön bedrohlich vor. Aus vielerlei Gründen. Kreative fühlen sich teilweise in ihrer kompletten Identität bedroht. All die vielen Schweiß- und Blut-treibenden Jahre, in denen man sich die Zähne an teuren und komplizierten Tools ausgebissen hat. Lernkurven, die man unter höchster Anstrengung überwunden hat, um endlich an einem professionellen Level anzukommen – um etwas Besonderes zu können.
Und jetzt kann es einfach jeder, der im Internet herum tollt? – Fühlt sich für viele Pros ganz schön degradierend und demotivierend an.

Und ja, viele Arbeitsschritte, die früher manuell und teuer umgesetzt wurden, kommen jetzt aus der Dose.
Das ist ein Umbruch, und zwar ein krasser. Einer, der die ganze Industrie umstülpt.
Aber die vollmundigen Versprechungen, die einem im Social Media um die Ohren geklatscht werden, sind teilweise sehr vereinfacht und übertrieben dargestellt. Ein Hype wie er im Buche steht.
Viele Ergebnisse, die da präsentiert werden, sind eben nicht mit einfachen Textprompts zu erreichen. Ich kann jedenfalls mit keiner Silbe bestätigen, dass ein professionelles Video mit eigenem Stil durch einen einzigen Videoprompt entstehen würde. Viele Schritte und eine klare Vision sind dafür notwendig. Genau so wichtig wie die Generierung sind der Kurationsprozess und die Postproduktion.


Um die richtigen Worte für Prompts zu finden, musst du wissen, was du willst.
Du musst die Design- und Filmsprachen kennen und eine Ahnung von Dramaturgie haben. All das kann man lernen. Aber es gibt keine KI die du dir ins Hirn uploaden kannst. Und ChatGPT, Gemini und co. können dir auch nur zum gewissen Grad helfen.
Ausblick
Ich glaube, wir stehen gerade erst am Anfang einer Phase, in der solche Workflows für Werbung, Entertainment und digitale Formate selbstverständlich werden.
Die Technik entwickelt sich rasant.
Spannend bleibt deshalb weniger die Frage, ob KI Inhalte erzeugen kann — sondern wer daraus etwas Eigenes macht.
Jetzt seid ihr dran
Wenn du wissen willst, wie sich solche Workflows sinnvoll in Markenkommunikation integrieren lassen, schreib mir.

Bringen wir deine Marke voran.
Lass uns kluge Strategie, spannenden Content und moderne, KI-gestützte Kommunikation nutzen, um dein Unternehmenswachstum sichtbar zu steigern.

