#178 Ein One-Take-Video-Konzept mithilfe eines Mehr-Agenten-Systems (CrewAI)

Worum geht es in diesem Artikel?

Wie helfen mir 7 Agenten um ein Drehbuch für die ersten 60 Sekunden eines Videos zu stellen. Von der Kamerführung bis hin zum Speakertext

Stell dir vor, du möchtest ein kurzes 60-Sekunden-Video erstellen, das auf beeindruckende Weise zeigt, wie man von chaotischen, frustrierenden Prompts hin zu effektiven und strukturierten Prompts kommt. Dabei sollst du Alltagsgegenstände, Motivation und leicht verständliche Metaphern einsetzen, um die Kraft von Prompt-Engineering zu transportieren. Und das Ganze in einem One-Take-Videoclip mit vier Kamerapositionen!

In diesem Blogpost zeige ich dir Schritt für Schritt, wie du mithilfe des CrewAI-Frameworks ein Mehr-Agenten-System aufbaust, das:

  1. Kreative Ideen (Impact-Techniken) generiert,
  2. Diese Ideen validiert,
  3. Einen Kamera- und Ablaufplan für den Dreh erstellt und
  4. Schließlich das finale Video-Skript schreibt.

All das läuft automatisiert und gut strukturiert ab, weil wir jeder KI-Agent*in eine ganz spezielle Rolle zuweisen. Schauen wir uns an, wie das Ganze in der Praxis funktioniert!

Hintergrund ist mein Bedürfnis mehr „professionelle“ Videos zu drehen und das mir die KI hilft Hooks zu formulieren mit einem passenden Drehbuch.

Wie bin ich zu den Agents gekommen? (Danke an Frank Plate)

Ich habe meine Ziele definiert und was ich haben möchte. Damit habe ich mir ein Agent-Grundgerüst gebaut mit den Agents (vergleichbar Teammitgliedern) die ich ins Spiel bringen wollte. Claude hat meine Agents nochmal überprüft und Tipps für die Umsetzung gegeben.


Das Projekt im Überblick

Unser Projekt folgt dem klassischen Prinzip „Idee – Validierung – Umsetzung – Skript“. Der Kern des Ganzen ist eine Crew aus mehreren Agents, die definierte Tasks in einer festen Reihenfolge abarbeiten. So entstehen am Ende zwei fertige 60-Sekunden-Skripte, die wir für den Workshop einsetzen können.

Hier ein kurzer Überblick über die wesentlichen Konstanten und Kontexte, die wir in unserem Code haben:

  • BRIEF: Enthält die Eckdaten und Ziele des 60-Sekunden-Videos (Botschaft, Ziel, Struktur, etc.).
  • IMPACT_REQUIREMENTS: Legt fest, wie die Impact-Technik aussehen soll (Relatierbarkeit, Transformation, Einfachheit, Schreibtisch-tauglich).
  • EXAMPLE_TECHNIQUES: Enthält beispielhafte Metaphern (Puzzle, Sortierung, Bausteine, Werkzeugkasten…).
  • CAMERA_SETUP: Beschreibt unser Vier-Kamera-Setup (Frontal, Oben, Links, Rechts).

Projektstruktur

Das Mehr-Agenten-System mit CrewAI

Was ist CrewAI?

CrewAI ist ein Python-Framework, das es dir erlaubt, mehrere KI-Agenten (basierend auf Large Language Models) in einer Crew zusammenzufassen. Jeder Agent hat eine definierte Rolle, z.B. Creative Director, Technik-Expertin, Skript-Schreiber usw. Diese Agenten erfüllen nacheinander Tasks, die klar definierte Inputs und gewünschte Outputs haben.

Warum Mehr-Agenten-Systeme?

  • Spezialisierung: Jeder Agent konzentriert sich auf eine bestimmte Aufgabe (z.B. Ideengenerierung oder Validierung).
  • Kollaboration: Die Zwischenergebnisse eines Agents können von einem anderen Agenten überprüft und verbessert werden.
  • Transparenz: Du siehst genau, wer welchen Schritt erledigt.

Ein Ausschnitt aus der Unterhaltung der Agents

# Agent: Impact Script Writer
## Final Answer: 
**0-5 Sekunden: Hook**
- Kamera: Vogelperspektive. 
- Licht: Helles, fokussiertes Licht auf die Hände und Knete.
- Aktion: Hände greifen nach einem undefinierbaren Knet-Klumpen. 
- Sprechtext: "Prompting mit KI - oft nur ein Chaos. Kommt dir das bekannt vor?"
- Betonung auf "Chaos" und "bekannt".
- Übergang bei 5 Sekunden: Schnitt zur Frontalansicht.

**5-15 Sekunden: Problem**
- Kamera: Frontalansicht. 
- Licht: Weiches Licht, um die Stimmung zu intensivieren.
- Aktion: Hände zerdrücken chaotisch die Knete, Gesichtsausdrücke zeigen Frustration.
- Sprechtext: "Genau so sehen die meisten KI-Antworten aus... Frustrierend, oder?"
- Betonung auf "genau so" und "frustrierend".
- Übergang bei 15 Sekunden: Weichblendung zur Seitenansicht Links.

**15-30 Sekunden: Transformation**
- Kamera: Seitenansicht Links. 
- Licht: Kontrastreich, um die Veränderung hervorzuheben.
- Aktion: Knete wird methodisch geformt, klare Methodik zeigen.
- Sprechtext: "Aber es geht auch anders... Schau, was passiert, wenn..."
- Betonung auf "anders" und "schau".
- Übergang bei 30 Sekunden: Fließender Schnitt zur Detailansicht Rechts.

**30-50 Sekunden: Solution**
- Kamera: Detailansicht Rechts. 
- Licht: Helle, klare Beleuchtung auf die nun strukturierte Knete.
- Aktion: Zeigen einer klaren, effektiven Struktur in der Knete, parallel zur Erläuterung.
- Sprechtext: "Mit der richtigen Technik werden aus wirren Ideen präzise Ergebnisse. 70% Zeitersparnis, klare Struktur."
- Betonung auf "präzise Ergebnisse" und "70% Zeitersparnis".
- Übergang bei 50 Sekunden: Schnitt zur Frontalansicht.

**50-60 Sekunden: Call-to-Action**
- Kamera: Frontalansicht. 
- Licht: Motivierend und einladend.
- Aktion: Direkter Blick in die Kamera, einladende Geste mit den Händen.
- Sprechtext: "Sichere dir einen von 12 Plätzen für nächsten Samstag. Deine Chance auf Klärung im KI-Chaos."
- Betonung auf "sichere dir" und "deine Chance".
- Übergang bei 60 Sekunden: Ausblendung.

**Technische Anweisungen:**
- Kontinuierliche Anpassung der Lichtstärke und -richtung, um den emotionalen Arc zu unterstützen.
- Schnelle, präzise Kameraübergänge zur Unterstützung des narrativen Flusses.
- Einsatz von Nah- und Detailaufnahmen zur Visualisierung der Transformation.

**Gestenbeschreibungen:**
- Während des Hooks und Problems expressive Handbewegungen, um Unordnung und Frustration zu zeigen.
- Bei der Transformation und Lösung gezielte, methodische Bewegungen, die Ordnung und Struktur vermitteln.
- Im Call-to-Action offene, einladende Gesten, die zum Handeln motivieren.


# Agent: Quality Assurance Expert
## Task: 
                Führe die finale Qualitätskontrolle durch.

                PRÜFKRITERIEN:
                1. IMPACT-TECHNIK
                - Metaphorische Klarheit
                - Transformationsstärke
                - Nachhaltigkeit

                2. TECHNISCHE UMSETZUNG
                - One-Take-Machbarkeit
                - Timing-Präzision
                - Fehlertoleranz

                3. ZIELGRUPPEN-WIRKUNG
                - Problem-Solution Fit
                - Emotionale Resonanz
                - Call-to-Action Stärke

                4. GESAMTQUALITÄT
                - Professionelle Anmutung
                - Durchgängige Qualität
                - Nachhaltige Wirkung

                WARNSIGNALE:
                content:
- Zu technische Sprache
- "Fehlender pers\xF6nlicher Bezug"
- Abstrakte Konzepte
- Komplizierte Setups
flow:
- Zu langsamer Hook
- Unklare Transformation
- Fehlende Messbarkeit
- Schwacher Call-to-Action


                LIEFERE:
                1. Detaillierte Qualitätsanalyse
                2. Kritische Erfolgsfaktoren
                3. Verbesserungsvorschläge
                4. Finale Freigabeempfehlung
                


# Agent: Quality Assurance Expert
## Final Answer: 
**1. Detaillierte Qualitätsanalyse**

*Impact-Technik:*
- **Metaphorische Klarheit:** Die Verwendung von Knete als Metapher für Chaos und Transformation in KI-Prozessen ist kreativ und verständlich. Die metaphorische Klarheit ist hoch.
- **Transformationsstärke:** Die Transformation von Chaos zu Struktur durch die Knete ist visuell stark umgesetzt und leicht nachvollziehbar.
- **Nachhaltigkeit:** Die Botschaft der nachhaltigen Verbesserung durch Anwendung der richtigen Techniken ist klar und motivierend.

*Technische Umsetzung:*
- **One-Take-Machbarkeit:** Die kontinuierliche Anpassung von Licht und Kameraübergängen ist technisch anspruchsvoll, aber machbar und unterstützt den narrativen Fluss effektiv.
- **Timing-Präzision:** Die präzisen Übergänge und die gut getimte Betonung im Sprechtext sind hervorragend umgesetzt.
- **Fehlertoleranz:** Das Setup scheint robust gegenüber kleinen Fehlern, was die Nachvollziehbarkeit und die Gesamtqualität nicht beeinträchtigt.

*Zielgruppen-Wirkung:*
- **Problem-Solution Fit:** Die Darstellung des Problems und die präsentierte Lösung passen exzellent zur Zielgruppe, die mit KI-Arbeit frustriert ist.
- **Emotionale Resonanz:** Die Darstellung erzeugt starke emotionale Resonanz, indem sie Frustration und die Befriedigung der Lösung visualisiert.
- **Call-to-Action Stärke:** Der Call-to-Action ist klar, motivierend und bietet einen konkreten nächsten Schritt.

*Gesamtqualität:*
- **Professionelle Anmutung:** Die durchdachte Lichtführung, Kameraarbeit und die klare Botschaft sorgen für eine professionelle Anmutung.
- **Durchgängige Qualität:** Von Anfang bis Ende ist die Qualität konsistent hoch.
- **Nachhaltige Wirkung:** Die klare Botschaft und die visuelle Umsetzung haben das Potenzial für eine langanhaltende Wirkung bei der Zielgruppe.

**2. Kritische Erfolgsfaktoren**

Die kritischen Erfolgsfaktoren für das Projekt sind:
- Die Einhaltung der technischen Präzision, insbesondere bei Licht und Kameraübergängen.
- Die Aufrechterhaltung der metaphorischen Klarheit und Transformationsstärke.
- Die emotionale Resonanz und die Stärke des Call-to-Action, um die Zielgruppe zum Handeln zu motivieren.

**3. Verbesserungsvorschläge**

Obwohl die Umsetzung bereits auf hohem Niveau ist, könnten folgende Verbesserungen in Betracht gezogen werden:
- Ein noch stärkerer Fokus auf die persönliche Ebene im Problemabschnitt könnte die emotionale Resonanz weiter erhöhen.
- Die Integration von Erfahrungsberichten oder Testimonials im Solution- oder Call-to-Action-Teil könnte die Glaubwürdigkeit und damit die Wirkung verstärken.

**4. Finale Freigabeempfehlung**

Basierend auf der detaillierten Analyse und unter Berücksichtigung der hohen Qualität in allen Prüfkriterien sowie dem Fehlen von Warnsignalen empfehle ich die finale Freigabe dieses Projekts. Es erfüllt die Anforderungen an Impact-Technik, technische Umsetzung, Zielgruppen-Wirkung und Gesamtqualität in herausragender Weise.



Finales Ergebnis: **1. Detaillierte Qualitätsanalyse**

*Impact-Technik:*
- **Metaphorische Klarheit:** Die Verwendung von Knete als Metapher für Chaos und Transformation in KI-Prozessen ist kreativ und verständlich. Die metaphorische Klarheit ist hoch.
- **Transformationsstärke:** Die Transformation von Chaos zu Struktur durch die Knete ist visuell stark umgesetzt und leicht nachvollziehbar.
- **Nachhaltigkeit:** Die Botschaft der nachhaltigen Verbesserung durch Anwendung der richtigen Techniken ist klar und motivierend.

*Technische Umsetzung:*
- **One-Take-Machbarkeit:** Die kontinuierliche Anpassung von Licht und Kameraübergängen ist technisch anspruchsvoll, aber machbar und unterstützt den narrativen Fluss effektiv.
- **Timing-Präzision:** Die präzisen Übergänge und die gut getimte Betonung im Sprechtext sind hervorragend umgesetzt.
- **Fehlertoleranz:** Das Setup scheint robust gegenüber kleinen Fehlern, was die Nachvollziehbarkeit und die Gesamtqualität nicht beeinträchtigt.

*Zielgruppen-Wirkung:*
- **Problem-Solution Fit:** Die Darstellung des Problems und die präsentierte Lösung passen exzellent zur Zielgruppe, die mit KI-Arbeit frustriert ist.
- **Emotionale Resonanz:** Die Darstellung erzeugt starke emotionale Resonanz, indem sie Frustration und die Befriedigung der Lösung visualisiert.
- **Call-to-Action Stärke:** Der Call-to-Action ist klar, motivierend und bietet einen konkreten nächsten Schritt.

*Gesamtqualität:*
- **Professionelle Anmutung:** Die durchdachte Lichtführung, Kameraarbeit und die klare Botschaft sorgen für eine professionelle Anmutung.
- **Durchgängige Qualität:** Von Anfang bis Ende ist die Qualität konsistent hoch.
- **Nachhaltige Wirkung:** Die klare Botschaft und die visuelle Umsetzung haben das Potenzial für eine langanhaltende Wirkung bei der Zielgruppe.

**2. Kritische Erfolgsfaktoren**

Die kritischen Erfolgsfaktoren für das Projekt sind:
- Die Einhaltung der technischen Präzision, insbesondere bei Licht und Kameraübergängen.
- Die Aufrechterhaltung der metaphorischen Klarheit und Transformationsstärke.
- Die emotionale Resonanz und die Stärke des Call-to-Action, um die Zielgruppe zum Handeln zu motivieren.

**3. Verbesserungsvorschläge**

Obwohl die Umsetzung bereits auf hohem Niveau ist, könnten folgende Verbesserungen in Betracht gezogen werden:
- Ein noch stärkerer Fokus auf die persönliche Ebene im Problemabschnitt könnte die emotionale Resonanz weiter erhöhen.
- Die Integration von Erfahrungsberichten oder Testimonials im Solution- oder Call-to-Action-Teil könnte die Glaubwürdigkeit und damit die Wirkung verstärken.

**4. Finale Freigabeempfehlung**

Basierend auf der detaillierten Analyse und unter Berücksichtigung der hohen Qualität in allen Prüfkriterien sowie dem Fehlen von Warnsignalen empfehle ich die finale Freigabe dieses Projekts. Es erfüllt die Anforderungen an Impact-Technik, technische Umsetzung, Zielgruppen-Wirkung und Gesamtqualität in herausragender Weise.

Der Code im Detail

Das Script ist ein Überblick um ein Verständnis für die Abfolge zu bekommen, ich habe die Variablen Anteile (Thema etc) von dem Hauptscript in der finalen Version getrennt.

# Imports
from crewai import Agent, Task, Crew
from langchain_community.chat_models import ChatOpenAI

# LLM Definition
llm = ChatOpenAI(
model_name="gpt-4o",
temperature=0.7
)

# Konstanten
BRIEF = """
60-Sekunden Impact-Video für Prompt-Engineering Workshop:
KERNBOTSCHAFT: "Von chaotischen zu effektiven Prompts"
ZIEL: Zeigen wie man von frustrierendem Trial-and-Error zu systematischem Prompting kommt

STRUKTUR:
- 15s: Zeige typische Prompt-Fehler & Frustration (ohne Abwertung)
- 15s: Transformation durch systematische Methode
- 20s: Erfolgreiche Ergebnisse durch strukturiertes Prompting
- 10s: Einladung zum Workshop

WICHTIG:
- Empathisch: "Ich kenne das Problem selbst..."
- Lösungsorientiert: "Es gibt eine systematische Methode..."
- Motivierend: "Mit der richtigen Technik ist es einfach..."
"""

IMPACT_REQUIREMENTS = """
Die Impact-Technik muss:

1. RELATIERBAR sein:
- Typische Prompt-Frustration zeigen
- "Ich kenne das"-Moment erzeugen
- Motivation zur Verbesserung wecken

2. TRANSFORMATION zeigen:
- Von Chaos zu Struktur
- Von Unsicherheit zu Methode
- Von Frustration zu Erfolg

3. EINFACH verständlich sein:
- Direkte Metapher für Prompting
- Sofort erkennbare Verbesserung
- Klarer Lerneffekt

4. AM SCHREIBTISCH umsetzbar sein:
- Einfache Alltagsgegenstände
- One-Take durchführbar
- Fehlerresistent
"""

EXAMPLE_TECHNIQUES = """
Beispiele für effektive Metaphern:
1. Puzzle: Von verstreuten Teilen zum klaren Bild
2. Sortierung: Von Chaos zu System
3. Bausteine: Von zufällig zu strukturiert
4. Ordnungssystem: Von Durcheinander zu Methode
5. Werkzeugkasten: Von unsortiert zu organisiert
"""

CAMERA_SETUP = """
Vier-Kamera-Setup für One-Take:
1. FRONTAL: Hauptansicht der Person am Schreibtisch
2. OBEN: Vogelperspektive auf die Arbeitsfläche
3. LINKS: Seitenansicht für Transformation
4. RECHTS: Nahaufnahme für Details
"""

# Agent Definitions
creative_director = Agent(
role="Impact Technique Designer",
goal="Entwickle eine verständliche Metapher für die Verbesserung von Prompt-Engineering",
backstory=\"""Experte für lehrreiche Impact-Techniken:
- Spezialist für "Aha-Moment"-Gestaltung
- Erfahrung in der Visualisierung von Lernprozessen
- Fokus auf motivierende, nicht abwertende Darstellung
- Expertise in der Vermittlung technischer Konzepte\""",
llm=llm
)

impact_validator = Agent(
role="Learning Impact Validator",
goal="Stelle sicher, dass die Technik motiviert und Verständnis schafft",
backstory=\"""Lernpsychologe & Impact-Technik Experte:
- Expertise in der Validation von Lehrmethoden
- Fokus auf positive Lernerfahrungen
- Spezialist für Motivation und Verständnis
- Erfahrung mit Prompt-Engineering-Training\""",
llm=llm
)

technical_director = Agent(
role="One-Take Video Director",
goal="Plane die technische Umsetzung für maximale Wirkung",
backstory=\"""Video-Experte für Impact-Techniken:
- Spezialist für One-Take-Transformationen
- Expertise in Vier-Kamera-Setups
- Fokus auf klare visuelle Entwicklung
- Erfahrung mit Schreibtisch-Settings\""",
llm=llm
)

script_writer = Agent(
role="Educational Script Writer",
goal="Schaffe ein motivierendes Script das Verbesserung zeigt",
backstory=\"""Spezialist für Educational Storytelling:
- Expertise in der Vermittlung technischer Konzepte
- Fokus auf positive Transformation
- Erfahrung mit "Vorher/Nachher"-Narrativen
- Spezialist für präzise Timing-Strukturen\""",
llm=llm
)

# Task Definitions
generate_techniques = Task(
description=f\"\"\"{BRIEF}\\n{IMPACT_REQUIREMENTS}\\n{EXAMPLE_TECHNIQUES}

Entwickle 5 Impact-Techniken die zeigen wie man besser prompten lernt:

1. RELATIERBARES PROBLEM:
- Typische Prompt-Fehler visualisieren
- Frustration verständlich machen
- Empathisch bleiben

2. KLARE TRANSFORMATION:
- Von chaotischem zu strukturiertem Prompting
- Sichtbare Verbesserung
- "Aha-Moment" erzeugen

3. MOTIVATION WECKEN:
- "Das kann ich auch lernen"
- Einfache, aber effektive Methode
- Klaren Lernweg zeigen

4. MACHBARKEIT ZEIGEN:
- Mit System zum Erfolg
- Strukturierte Herangehensweise
- Wiederholbare Methode\"\"\"",
expected_output=\"\"\"5 lehrreiche Impact-Techniken die Prompt-Verbesserung zeigen, mit:
- Konkretem Ablauf
- Klarer Metapher
- Umsetzungsdetails\"\"\",
agent=creative_director
)

validate_impact = Task(
description=f\"\"\"Analysiere die vorgeschlagenen Impact-Techniken nach:

1. LERNWIRKUNG:
- Ist die Metapher sofort verständlich?
- Wird der Lernprozess klar?
- Entsteht ein "Aha-Moment"?

2. MOTIVATION:
- Werden Teilnehmer ermutigt?
- Ist der Lernweg nachvollziehbar?
- Wirkt die Methode erreichbar?

3. UMSETZBARKEIT:
- Funktioniert es in einem Take?
- Sind die Objekte geeignet?
- Ist die Transformation klar?

Wähle die 2 effektivsten Techniken aus.\"\"\"",
expected_output="Detaillierte Analyse und Auswahl der 2 besten Techniken",
agent=impact_validator
)

develop_camera_plan = Task(
description=f\"\"\"{CAMERA_SETUP}

Entwickle für die ausgewählten Techniken:
1. EXAKTE KAMERAFÜHRUNG:
- Position und Bewegung je Kamera
- Timing der Wechsel
- Wichtige Fokuspunkte

2. CHOREOGRAPHIE:
- Handlungsablauf
- Übergänge
- Kritische Momente

3. BACKUP-STRATEGIEN:
- Alternative Einstellungen
- Fehlerprävention
- Notfalloptionen\"\"\"",
expected_output="Detaillierter technischer Plan für beide Techniken",
agent=technical_director
)

create_final_scripts = Task(
description=f\"\"\"{BRIEF}

Erstelle für beide Techniken präzise 60-Sekunden-Scripts mit:
1. EXAKTEN ANWEISUNGEN:
- Kameraführung
- Handlungen
- Dialoge

2. TIMING-DETAILS:
- Sekundengenaue Marker
- Übergangspunkte
- Synchronisation

3. SPRECHTEXTE:
- Motivierende Botschaften
- Klare Lernerfolge
- Überzeugendes Call-to-Action\"\"\"",
expected_output="2 finale Video-Scripts mit allen Details",
agent=script_writer
)

# Crew Definition
video_crew = Crew(
agents=[
creative_director,
impact_validator,
technical_director,
script_writer
],
tasks=[
generate_techniques,
validate_impact,
develop_camera_plan,
create_final_scripts
],
verbose=True
)

# Ausführung
result = video_crew.kickoff()
print("\nFinales Ergebnis:", result)

Die Agenten im Überblick

1. Impact Technique Designer (creative_director)

Rolle: Entwickelt starke, visuelle Metaphern für das ausgewählte Thema, um die Verbesserung durch Prompt-Engineering klar zu machen.
Fokus: Kreativität, Aha-Momente, motivierende Darstellung, sofortige visuelle Wirkung.


2. Hook & Opening Expert (hook_expert)

Rolle: Sorgt für einen packenden Einstieg und entwickelt 5-Sekunden-Hooks, die die Aufmerksamkeit der Zuschauer*innen sofort fesseln.
Fokus: Problem-Resonanz, emotionale Bindung, psychologische Trigger, sofortige Aktivierung der Zielgruppe.


3. Impact Technique Validator (impact_validator)

Rolle: Validiert die vorgeschlagenen Impact-Techniken hinsichtlich Wirksamkeit und Umsetzbarkeit.
Fokus: Lernpsychologie, Motivation, nachhaltiger Lernerfolg, Beaulieu-Standards, Machbarkeit in einem einzigen Dreh.


4. One-Take Technical Director (technical_director)

Rolle: Plant die komplette technische Umsetzung, um das Video in einem Take (ohne Schnitte) zu realisieren.
Fokus: Vier-Kamera-Setup, Beleuchtung, Choreographie, minimale Fehlerquote, reibungslose Transformation.


5. Timing & Flow Coordinator (timing_coordinator)

Rolle: Verantwortet den präzisen Ablauf, sodass die gesamte Videostruktur (Hook, Problem, Transformation, Lösung, CTA) sekundengenau in 60 Sekunden passt.
Fokus: Sekundengenaue Abläufe, nahtlose Übergänge, Spannungsaufbau, fließende Bewegungen, perfekte Synchronisation.


6. Impact Script Writer (script_writer)

Rolle: Schreibt das finale Video-Skript mit genauem Spannungsbogen, klaren Dialogen und präzisen Timingangaben.
Fokus: „Vorher/Nachher“-Narrative, motivierender Ton, vollständiges Storyboard, passender Sprechtext, überzeugende Call-to-Action.


7. Quality Assurance Expert (quality_expert)

Rolle: Prüft final die Qualität des gesamten Konzepts und gibt eine Freigabeempfehlung ab.
Fokus: Ganzheitliche Qualitätssicherung, Fehlerprävention, Zielgruppen-Impact, nachhaltige Wirkung, professionelles Gesamtergebnis.


Die Tasks im Detail

1. generate_techniques

  • Input: BRIEF, IMPACT_REQUIREMENTS, EXAMPLE_TECHNIQUES
  • Agent: creative_director
  • Beschreibung: Der Impact Technique Designer erhält alle nötigen Infos (Problem, Ziel, Beispielmetaphern) und soll 5 neue Impact-Techniken entwerfen, die deutlich machen, wie man „besser prompten lernt“.
  • Output: Eine Liste mit 5 Vorschlägen, inklusive Ablauf, Metapher und Umsetzungsideen.

2. validate_impact

  • Input: Die 5 Techniken aus generate_techniques.
  • Agent: impact_validator
  • Beschreibung: Der Learning Impact Validator analysiert jede Idee in Bezug auf Lernwirkung, Motivation und Umsetzbarkeit und wählt die 2 besten aus.
  • Output: Detaillierte Analyse und die Auswahl der zwei stärksten Techniken.

3. develop_camera_plan

  • Input: Die zwei ausgewählten Techniken aus validate_impact.
  • Agent: technical_director
  • Beschreibung: Erstellt einen technischen Plan: Wo stehen die Kameras, wann wird umgeschaltet, wie sieht die Choreographie aus, und welche Backups gibt es?
  • Output: Ein detaillierter Kamera- und Ablaufplan für beide Techniken.

4. create_final_scripts

  • Input: Der Kameraplan und die Techniken aus den vorherigen Tasks.
  • Agent: script_writer
  • Beschreibung: Verwandelt die Ideen und den Kamera-Plan in zwei komplette 60-Sekunden-Skripte (mit Timing, Sprechtext, Aktionen).
  • Output: Zwei finale Skripte, eins für jede Technik.

Task-Sequenz


Wie läuft die Ausführung ab?

  1. video_crew = Crew(...)
    In dieser Zeile legen wir unsere Agenten und Tasks an und bestimmen die Reihenfolge.
  2. result = video_crew.kickoff()
    Damit starten wir den gesamten Prozess. CrewAI ruft automatisch jede Task in der richtigen Reihenfolge auf.
  3. Ergebnis
    In der Konsole oder als Rückgabewert (result) erhalten wir das Endergebnis – die fertigen Skripte.

Was macht dieses Skript besonders?

  • Wir fokussieren uns auf Lernpsychologie: Die Metaphern sollen nicht nur „wow“ sein, sondern auch motivieren und Verständnis schaffen.
  • Wir berücksichtigen die One-Take-Umsetzung mit einem Vier-Kamera-Setup. Das erhöht den Realismus und vermeidet komplizierte Schnitte.
  • Wir sorgen für eine klare Zeitstruktur (15s Problem – 15s Transformation – 20s Resultat – 10s CTA), damit das Video nicht zu lang oder zu kurz wird.

Möglichkeiten für Erweiterungen

  1. Feedback-Schleife: Ich könnte einen zusätzlichen Agenten definieren, der das finale Skript noch einmal gegenliest oder testweise abspielt (z.B. ein „Quality Assurance Agent“).
  2. Automatisierte Video-Generierung: Auf Basis des Skripts ließe sich ein Tool integrieren, das automatisch ein Video oder einen animierten Prototyp erzeugt. Hier könnte man HeyGen integrieren.
  3. Mehrere Sprachen: Ich könnte pro Task verschiedene Sprachversionen erstellen lassen (z.B. Englisch, Deutsch). CrewAI würde dann die Agents sequentiell mehrsprachig abfragen.
  4. Detailliertes Prompt-Engineering im Script: Man könnte in einer Extra-Task das Skript generieren lassen, das erklärt, wie man selbst gute Prompts schreibt – z.B. mit einer konkreten Methode (SHARP, PROMPT, etc.).

Zusammenfassung und Fazit

Mit diesem Skript und den Anpassungen haben wir:

  • Einen systematischen Ablauf definiert: Idee → Validierung → Kamera-Plan → Skript.
  • Vier spezialisierte Agenten integriert, die jeweils nur ihre Kernkompetenz einsetzen.
  • Klare Anforderungen an die Impact-Technik formuliert, um sicherzustellen, dass sie leicht verständlich, motivierend und in einem One-Take umsetzbar ist.
  • Ein finales Resultat in Form von zwei 60-Sekunden-Skripten, das direkt genutzt werden kann, um ein Workshop-Video zu produzieren.

Du siehst, wie mächtig Mehr-Agenten-Systeme sein können, wenn jeder Agent seinen ganz eigenen Job hat und die Zusammenarbeit reibungslos konfiguriert ist. Das System kann natürlich beliebig erweitert oder angepasst werden, je nach Projektumfang.

Nächste Schritte

  • Passe die Rollen an: Vielleicht brauchst du einen reinen Story-Editor-Agenten oder möchtest eine zusätzliche Ebene für Social Media Marketing.
  • Experimentiere mit Temperature: Die temperature=0.7 in unserem LLM-Setup steuert die Kreativität. Erhöhe oder verringere den Wert und beobachte, wie unterschiedlich die Ideen ausfallen.
  • Baue Sicherheitschecks ein: Für komplexere Projekte bietet es sich an, via Logs und Validierungstasks ungewünschte Ausgaben zu filtern.

Bonus: Mini-FAQ

  1. Brauche ich für jedes Projekt sieben Agenten?
    Nein, du kannst auch nur zwei oder drei Agenten nutzen. Die Anzahl richtet sich nach deinen Rollen und Zielen.
  2. Was, wenn ich nur eine Idee generieren will?
    Dann reicht ein Agent mit einer einzigen Task. CrewAI ist sehr flexibel.
  3. Kann ich GPT-3.5 statt GPT-4-Turbo verwenden?
    Ja, du kannst jedes Language Model benutzen, das vom entsprechenden Backend unterstützt wird. Achte aber auf mögliche Unterschiede in Qualität und Reaktionszeit.
  4. Wie debugge ich die Output-Fehler?
    Setze verbose=True (wie im Beispiel), um detaillierte Logs zu bekommen. Oder erstelle spezielle Review-Tasks, die Ausgaben prüfen und ggf. neu anstoßen.
  5. Läuft das auch in der Cloud?
    Ja, du kannst das Ganze auf lokalen Maschinen oder in der Cloud ausführen, solange du Zugriff auf das entsprechende LLM (z.B. OpenAI-API) hast.

Teile diesen Artikel

Ähnliche Beiträge