#147 Wie kann man Daten im Vector Speicher gezielt abfragen?

Worum geht es in diesem Artikel?

In welchem Blogpost habe ich über das Thema XY geschrieben? Der Blogpost zeigt wie man gezielt den OpenAI VectorStore über Json Dateien als Input abfragen kann.

Ich möchte meine ganzen Blogpost gezielt nach Inhalten abfragen um bei neuen Themen in einem Workflow passende Links einzufügen.

Eine Abfrage wäre: in welchen Posts schreibe ich über AudioPen? Dann möchte ich als Ergebnis eine kurze Zusammenfassung und den Link als Ergebnis?

Wie kann ich das aufbauen?

Meine ganzen Blogpost liegen in einer Airtable Datenbank. Titel, Text und ArtikelLink sind erstmal für mich wichtig.

Übersicht über meine Blog-Artikel – hier die Suche nach AudioPen

Die Json Dateien

Damit die KI eine Hierarchie erstellen kann und weiß wo welche Informationen zu finden sind, braucht es eine strukturierte Darstellung der Blogpost in so einem Format.

{
"title": "Titel des Blogposts",
"text": "Hier ist der vollständige Text des Blogposts. Er kann mehrere Absätze und Formatierungen enthalten.",
"url": "https://www.beispielseite.de/blogpost"
}

Wie erstelle ich eine solche Json Datei die ich in den Vector Store hochladen kann von OpenAI?

Kollege OpenAi hat mir in 2 Minuten ein Programm geschrieben das mir eine Json Datei meiner Blogposts erstellt.

Python Programm um eine Json Datei zu erstellen

Das Ergebnis ist eine Json Datei meiner Blogposts. Diese Datei lade ich nach OpenAI in den Vectorstore und dann in make.com einen Assistent abfragen.

OpenAI Vector Store

Abfrage in Make.com

Abfrage nach Assistants in Make.com

Der Prompt sieht als erstes so aus, ich frage nach AudioPen. Für einen generischen Workflow kann ich das dynamisch über Variablen lösen.

Man kann noch andere Meta-Daten (Tags, Datum der Erstellung…) einbringen, die baue ich im nächsten Workflow ein.

Fazit

Um genauere Ergebnisse zu erhalten lohnt die Aufbereitung der Daten in einem Json Format.

Teile diesen Artikel

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert