In der modernen digitalen Kommunikation kommen zunehmend KI-basierte Systeme zum Einsatz, um Serviceanfragen effizient und automatisiert zu beantworten. Sematell bietet zwei prominente Vertreter dieser Entwicklung. Beide Plattformen setzen auf künstliche Intelligenz, unterscheiden sich jedoch grundlegend in Bezug auf die verwendeten Lerndaten, deren Herkunft und die Art und Weise, wie die KI am Ende agiert. In diesem Artikel nehmen wir die beiden Systeme genau unter die Lupe und beleuchten ihre Unterschiede aus technischer und praktischer Sicht.
Lerndaten bilden das Fundament jedes KI-Systems. Sie bestehen aus Beispielen, die genutzt werden, um der künstlichen Intelligenz beizubringen, wie sie Aufgaben lösen kann, etwa das Beantworten von E-Mails oder Kundenanfragen. Die Qualität und Vielfalt dieser Daten bestimmen maßgeblich, wie zuverlässig, präzise und flexibel die KI agieren kann.
Unsere Software-Lösungen haben unterschiedliche Anforderungen. Die eine Lösung erwartet als Lerndaten Datensätze, die im Wesentlichen den Inhalt einer Email ausmachen, d.h. ohne die Grußformel, wie „Sehr geehrte Damen und Herren“ oder „Hallo“ und ohne Abschiedsformel, z.B. „Mit freundlichen Grüßen…“. Was zwischen den beiden genannten Bereichen steht, das erwartet die Software als Textdatei in einem Verzeichnis, auf das sie zugreifen kann. Selbstverständlich werden die Daten vor dem Einlesen im System anonymisiert.
Für die Software ist es wichtig, dass die Lerndaten „echte“ Kundendaten sind und nicht von einem Mitarbeiter niedergeschrieben wurden, damit Unterschiede in der Tonalität, Ausdrucksweise und Stimmung erfasst werden. Das hat zur Folge, dass sie „nur“ die Informationen hat, die ihm vom Contact Center zur Verfügung gestellt wurden.
Unsere neue Software-Lösung ReplyX hat die Lerndaten schon in Form einer großen Datenbank im Gepäck, wenn es bei den Kunden ankommt. Das LLM (Large Language Model, übersetzt „Großes Sprachmodell“) hat das Internet durchsucht und daraus gelernt, wie die Sprache funktioniert, wie ein Antwortschreiben gestaltet ist, etc. Spezifische Informationen können als Retrieval Argumented Generation (RAG) oder im Prompt direkt oder als Quellenangabe im Prompt, z.B. in Form einer URL, mitgegeben werden.
Die KI in ReplyOne basiert überwiegend auf klassischem, überwachten Machine-Learning- und regelbasierten Ansätzen. Der Trainingsprozess läuft wie folgt ab:
Die KI kennt nur die Daten und Szenarios, mit denen sie trainiert wurde. Das so oft erwähnte „fantasieren“ der KI findet nicht statt, da die KI nicht generativ ist, sondern „nur“ nach statistischen Verfahren kategorisiert und vorgegebene Bausteine auswählt.
ReplyX nutzt fortgeschrittene Deep-Learning-Architekturen, speziell ein großes Sprachmodell, das kontextsensitiv und adaptiv arbeitet. Der Lernprozess ist ein ungesteuertes Sammeln und Analysieren von Textdaten, typischerweise aus dem Internet.
Durch diese technologisch fortschrittliche Arbeitsweise kann sie auch mit unvorhergesehenen oder besonders kreativen Anfragen umgehen. Spezielle Informationen können über RAG oder den Prompt zugeführt werden.
Beide Systeme legen Wert auf Datenschutz und -sicherheit, allerdings mit unterschiedlichen Schwerpunkten:
Software mit maschinellem Lernen:
Software mit Large Language Model:
FAZIT: Will ich zu 100% nachvollziehbare Ergebnisse und auf immer die gleiche Frage immer die gleiche Antwort haben, dann geht kaum ein Weg an einer KI, die mittels Machine Learning trainiert wurde, vorbei. Kann ich damit leben, dass die Antworten auf gleiche Anfragen thematisch richtig, aber im Wortlaut leicht differierend sind, dann ist eine KI, die ein LLM benutzt, die bessere Wahl.