Was ein guter Chatbot wirklich leistet
Ein Chatbot, der deinem Unternehmen echten Nutzen bringt, macht drei Dinge gut: Er gibt schnell eine konkrete Antwort auf eine spezifische Frage, er weiss, wann die Antwort ausserhalb seines Wissens liegt, und er leitet den Nutzer dann an einen Menschen weiter. Das klingt einfach, aber die meisten Chatbots, die ich sehe, scheitern an allen drei Punkten.
- ▸Gezielte Antworten: Der Chatbot ruft Informationen aus deinen eigenen Quellen ab und zitiert diese. Ein Mitarbeiter, der nach seinem Urlaubssaldo fragt, bekommt die korrekte Zahl, nicht eine allgemeine Erklarung, wie Urlaub normalerweise funktioniert.
- ▸Abgrenzung: Der Chatbot weiss, was ausserhalb seines Wissensbereichs liegt. Fragen, die anhand der verfugbaren Dokumente nicht beantwortet werden konnen, werden nicht mit einer Vermutung beantwortet.
- ▸Eskalation: Wenn der Chatbot die Antwort nicht hat oder eine Frage eine menschliche Entscheidung erfordert, sagt er das explizit und bietet eine Ubergabe an einen Mitarbeiter oder ein Kontaktformular an.
Diese drei Eigenschaften entstehen nicht automatisch aus einem Sprachmodell. Sie ergeben sich aus den richtigen Architekturentscheidungen: Welche Wissensquelle, wie Dokumente indexiert werden, wie Prompts aufgebaut sind und welche Grenzen fest einprogrammiert werden.
Was ein schlechter Chatbot tut und warum er Schaden anrichtet
Viele Unternehmen, die einen Chatbot wollen, bekommen einen Wrapper um ein generisches Sprachmodell. Der Chatbot hat Zugang zu allem, was das Modell weiss: Internet, Nachrichten, allgemeines Wissen. Das Ergebnis ist ein Bot, der Fragen mit Informationen beantwortet, die nichts mit deinem Unternehmen zu tun haben.
- ▸Generische Antworten: Ein Kunde fragt nach deiner Ruckgaberichtlinie und bekommt eine Erklarung, wie Rucksendungen im Allgemeinen funktionieren. Nicht das, was dein Unternehmen tatsachlich handhabt.
- ▸Halluzinationen: Das Modell erfindet spezifische Details, wenn diese nicht in seinem Kontext vorhanden sind. Preis, Lieferzeit, Artikelnummer, alles kann so generiert werden, als ob es korrekt ware.
- ▸Lead-Capture-Schleifen: Einige Chatbots sind darauf ausgelegt, E-Mail-Adressen zu sammeln. Sie stellen Fragen, lenken ab und geben nie die Antwort, nach der der Nutzer sucht.
- ▸Kein Gedachtnis des vorherigen Gesprachszugs: Eine mehrstufige Konversation, bei der der Chatbot jede Frage als neu behandelt, ohne Kontext aus dem Gesagten.
- ▸Antworten, die deiner Richtlinie widersprechen: Ein Bot, der sagt, dass etwas moglich ist, was du als Unternehmen nicht anbietest, oder der einen falschen Preis nennt.
Schaden durch einen schlechten Chatbot ist nicht immer sofort sichtbar. Er zeigt sich in Besuchern, die abspringen, in Kundenservice-Tickets uber Dinge, die der Chatbot falsch kommuniziert hat, und im Vertrauensverlust bei Kunden, die einmal irrefuhrt wurden.
Mein Ansatz: RAG uber deine eigenen Dokumente
RAG steht fur Retrieval-Augmented Generation. Anstatt ein Sprachmodell zu bitten, aus dem Gedachtnis zu antworten, lasse ich das Modell in einer Vektordatenbank suchen, die mit deinen Dokumenten gefullt ist. Das Modell antwortet auf Basis dessen, was es in dieser Datenbank findet, nicht auf Basis von allgemeinem Internet-Wissen.
Der Ablauf sieht so aus: Deine Dokumente werden geladen, in Abschnitte aufgeteilt und in Vektordarstellungen umgewandelt. Wenn ein Nutzer eine Frage stellt, sucht das System zunachst nach den relevantesten Textabschnitten und gibt diese als Kontext an das Sprachmodell weiter. Das Modell formuliert dann eine Antwort genau auf Basis dieser Abschnitte.
- ▸Wissensquellen, die ich indexiere: PDF-Dokumente, Word-Dateien, Markdown-Wissensbasen, CSV-Produktkataloge, FAQ-Seiten, Confluence-Exporte, Notion-Exporte.
- ▸Automatische Aktualisierung: Wenn du ein Dokument aktualisierst, wird der Index automatisch aktualisiert. Der Chatbot arbeitet immer mit der neuesten Version.
- ▸Quellenzuordnung: Der Chatbot kann zeigen, auf welchem Dokument oder welchem Abschnitt eine Antwort basiert. Das macht Antworten verifizierbar.
- ▸Unsicherheitsschwelle: Wenn der Relevanzscore des gefundenen Fragments zu niedrig ist, ratt der Chatbot nicht. Er sagt ehrlich, dass er es anhand der verfugbaren Dokumente nicht weiss.
- ▸Sitzungsgedachtnis: Das Gesprach behalt den Kontext, sodass Folgefragen korrekt beantwortet werden.
Das Ergebnis ist ein Chatbot, der nur auf Basis dessen antwortet, was du ihm beigebracht hast. Keine Uberraschungen, keine Erfindungen, keine generischen Erklarungen, die nicht zu deinem Unternehmen passen.
Welche Sprachmodelle ich verwende und warum
Das Modell ist eine Entscheidung, die ich auf Basis deiner spezifischen Situation treffe. Es gibt keine universelle Antwort, welches Modell das beste ist. Claude von Anthropic ist meine erste Wahl fur Situationen, in denen Genauigkeit und Schlussfolgern mehr wiegen als Kosten. Claude hat starkes Instruktionsfolgeverhalten, geringe Halluzinationsneigung und gute Leistung bei Aufgaben, die erfordern, dass das Modell vorsichtig und ehrlich daruber ist, was es nicht weiss.
Fur volumengetriebene Szenarien, in denen Kosteneffizienz Prioritat hat, verwende ich die OpenAI-API. OpenAIs leichteres Modell bietet ausgezeichnete Qualitat bei niedrigen Kosten pro Token und ist fur Kundenservice-Bots geeignet, die viele kurze Fragen verarbeiten. Fur Unternehmen, die ihre Daten vollstandig auf eigener Infrastruktur behalten mochten, ist ein lokales Modell wie Llama die richtige Wahl. Es lauft auf deinem eigenen Server, keine Daten verlassen dein Netzwerk.
Die Modellwahl ist von der RAG-Architektur getrennt. Das Fundament, die Indexierung deiner Dokumente, die Retrieval-Logik und die Eskalationsregeln, ist identisch, unabhangig davon, welches Modell antwortet. Das bedeutet, dass das Modell spater ausgetauscht werden kann, ohne den gesamten Chatbot neu zu bauen.
Wo der Chatbot lebt: Website, Slack, Teams oder WhatsApp
Ein Chatbot besteht aus zwei Teilen: dem Backend (das Sprachmodell, die RAG-Pipeline, die Geschaftslogik) und der Schnittstelle, uber die Nutzer damit interagieren. Das Backend zu bauen ist die Kernarbeit. Die Schnittstelle ist eine Wahl, die davon abhangt, wer die Nutzer sind und wo sie bereits Zeit verbringen.
- ▸Website-Widget: Ein Chatfenster, das auf deiner eigenen Website erscheint. Geeignet fur Kundenservice, Produktberatung oder FAQ-Abwicklung fur Besucher. Ich baue dies als leichtgewichtige eingebettete Komponente ohne schwere Drittanbieter-Skripte.
- ▸Slack-Integration: Ein Bot, der Mitarbeiterfragen innerhalb deines Slack-Workspace beantwortet. Geeignet fur interne Wissensbasen, HR-Fragen oder IT-Support.
- ▸Microsoft Teams: Fur Unternehmen, die Microsoft 365 verwenden und ihren internen Bot in den bestehenden Arbeitsplatz integrieren mochten. Gleiches RAG-Backend, andere Schnittstelle.
- ▸WhatsApp Business: Fur Unternehmen mit Kunden, die WhatsApp als primaren Kommunikationskanal nutzen. Erfordert ein WhatsApp Business API-Konto.
- ▸Admin-Tool: Manchmal mochtest du keinen externen Kanal, sondern eine interne Suchschnittstelle uber deinen eigenen Dokumenten. Eine einfache Webanwendung, die Mitarbeiter nutzen, um schnell durch interne Dokumentation zu suchen.
Die Schnittstellenwahl bestimmt nicht die Qualitat der Antworten. Die sitzt in der RAG-Pipeline. Die Schnittstelle bestimmt die Nutzererfahrung und die Akzeptanz. Ein Chatbot, den Mitarbeiter in einem separaten System offnen mussen, wird weniger genutzt als ein Bot, der in dem Kanal antwortet, in dem sie bereits arbeiten.
-- Anonyme Fallstudie
Interne Wissensorganisation: Mitarbeiter fragen, Dokumente antworten
Eine wissensintensive Organisation hatte ein internes Wiki mit mehr als 800 Seiten. Mitarbeiter konnten Informationen nicht schnell finden. Suchanfragen lieferten zu viele Ergebnisse, und die richtige Seite war dennoch schwer zu identifizieren. Der Kundenservice verbrachte einen erheblichen Teil des Tages damit, interne Fragen von Kollegen zu beantworten.
Ich baute einen internen RAG-Chatbot, der das gesamte Wiki indexiert. Mitarbeiter stellen Fragen in naturlicher Sprache. Der Chatbot ruft den relevanten Abschnitt ab und gibt eine konkrete Antwort mit einem Link zur Quelldokumentation. Antworten, die ausserhalb des Wikis liegen, werden nicht generiert. In diesem Fall teilt der Chatbot explizit mit, dass keine Antwort in der internen Wissensbasis verfugbar ist.
Das System lauft auf eigener Infrastruktur. Keine externe API, die interne Dokumente verarbeitet. Der Index wird jede Nacht aktualisiert, sodass neue oder geanderte Seiten sofort verfugbar sind. Mitarbeiter mussen nicht verstehen, wie RAG funktioniert. Sie stellen eine Frage in Slack und bekommen eine Antwort.
Was ich nicht tue
Transparenz uber die Grenzen eines Chatbots ist genauso wichtig wie Transparenz uber seine Moglichkeiten. Es gibt Anfragen, die ich ablehne, nicht weil sie technisch unmoglich sind, sondern weil sie in einem Chatbot resultieren, der Schaden anrichtet.
- ▸Chatbot ohne Wahrheitsquelle: Ein Bot, der auf Basis von allgemeinem Internet-Wissen antwortet, ohne deine spezifischen Dokumente als Grundlage. Das fuhrt unweigerlich zu Antworten, die nicht zu deinem Unternehmen passen.
- ▸Chatbot, der 'alles weiss': Ein Bot ohne klaren Geltungsbereich. Wenn der Chatbot theoretisch jede Frage beantworten kann, aber keine konsistent gut, ist er schlimmer als kein Chatbot.
- ▸Marketing-Funnel-Bot ohne UX-Test: Ein Bot, der in erster Linie darauf ausgelegt ist, E-Mail-Adressen zu sammeln oder Leads zu qualifizieren, ohne dass die Nutzererfahrung getestet wurde.
- ▸Chatbot als Ersatz fur menschliches Urteil: Fur Entscheidungen mit rechtlichen, medizinischen oder finanziellen Konsequenzen ist ein Chatbot niemals der endgultige Entscheidungstrager. Ich baue Eskalation ein, keinen Ersatz fur menschliche Beratung.
- ▸Chatbot mit veralteten Dokumenten ohne Aktualisierungsmechanismus: Ein Bot, der zunachst gut funktioniert, aber nach sechs Monaten veraltete Informationen liefert, weil der Index nie aktualisiert wird.
Chatbot entwickeln lassen: Preise
Die Investition fur einen Chatbot hangt von der Anzahl der Wissensquellen, der Komplexitat der Eskalationslogik und der gewahlten Schnittstelle ab. Es gibt keinen Standardbetrag, der hier sinnvoll ware.
Auf Anfrage
Nimm Kontakt auf fur eine Einschatzung basierend auf deiner Situation. Ich gebe immer ein ehrliches Bild davon, was realistisch ist, vor dem Start.