Live-Webinar am 29. April: Exzellente Terminplanung - Effizient arbeiten & Kosten minimieren Kostenlos anmelden!
Blogartikel

Das Potenzial von Retrieval-Augmented Generation (RAG) für Organisationen mit vertraulichen Daten und Dokumentationen  

18. März 2025 | 7 Min.

Künstliche IntelligenzProjekt- und Portfoliomanagement

In der Ära der digitalen Transformation erkunden Organisationen zunehmend fortschrittliche Technologien zur Optimierung ihrer Abläufe. Eine solche Innovation ist Retrieval-Augmented Generation (RAG), ein KI-Ansatz, der die Leistungsfähigkeit der natürlichen Sprachgenerierung mit der Fähigkeit kombiniert, relevante Informationen aus umfangreichen Datensätzen abzurufen. RAG zeichnet sich durch die Bereitstellung präziser, kontextuell relevanter Antworten aus, indem generative Modelle mit der Echtzeit-Datenretrieval-Funktion ergänzt werden. Dieser Ansatz kann in verschiedenen Bereichen angewendet werden, darunter Kundenservice, Compliance, Wissensmanagement und weitere. In diesem Blogbeitrag untersucht unser Partner Accenture das Potenzial von RAG. Zudem werden die Vorteile, Herausforderungen und strategischen Überlegungen beleuchtet. 

Retrieval-Augmented Generation

Datenschutzbedenken bei RAG-Einsätzen ansprechen

Obwohl RAG enormes Potenzial bietet, müssen Organisationen, die mit sensiblen Daten arbeiten, den Datenschutz in den Vordergrund stellen. Bedenken hinsichtlich Vertraulichkeit, Sicherheit und regulatorischer Compliance können die Einführung behindern, wenn diese nicht angemessen berücksichtigt werden. Eine wesentliche Entscheidung betrifft die Wahl zwischen Open-Source- und Closed-Source-Modellen. Open-Source-Modelle bieten Transparenz und Anpassungsmöglichkeiten, erfordern jedoch möglicherweise robuste Sicherheitsmaßnahmen zum Schutz sensibler Daten. Closed-Source-Modelle hingegen bieten häufig integrierte Sicherheitsfunktionen, können jedoch in ihrer Flexibilität eingeschränkt sein. 

Darüber hinaus beeinflussen die Bereitstellungsoptionen den Datenschutz. Cloud-basierte Lösungen, beispielsweise die Nutzung von RAG-Funktionen über APIs wie ChatGPT auf Azure, bieten Skalierbarkeit und Benutzerfreundlichkeit. Allerdings müssen Organisationen sicherstellen, dass sie die Datenschutzbestimmungen einhalten, und könnten Bedenken hinsichtlich der Speicherung sensibler Informationen auf Servern Dritter haben. Die Implementierung von RAG auf privaten Cloud-Instanzen oder in eigener Infrastruktur begegnet diesen Herausforderungen, da sie eine größere Kontrolle über die Daten ermöglicht, jedoch mit höheren Aufwänden für Einrichtung und Wartung verbunden sein kann. Ein hybrider Ansatz, bei dem kritische Daten on-premise bleiben, während Cloud-Ressourcen für weniger sensible Vorgänge genutzt werden, kann eine ausgewogene Lösung darstellen. 

Anwendungsfälle für RAG in Organisationen mit vertraulichen Dokumentationen

Organisationen mit umfangreichen Beständen an vertraulichen Dokumentationen können RAG nutzen, um in verschiedenen funktionalen Bereichen Werte zu schaffen. Hier sind einige Anwendungsfälle: 

Wissensmanagement

Effizientes Wissensmanagement ist entscheidend für Organisationen mit umfangreichen internen Dokumentationen. RAG ermöglicht es Mitarbeitenden, schnell auf präzise Informationen aus Handbüchern, Richtlinien und Schulungsmaterialien zuzugreifen. Der Einsatz von RAG kann die Produktivität steigern, Arbeitsabläufe optimieren und die Zeit, die mit der Suche nach relevanten Informationen verbracht wird, erheblich reduzieren. 

Kundensupport

In kundenorientierten Rollen kann RAG den Agenten sofortigen Zugriff auf genaue Antworten aus einer Datenbank mit Produktinformationen, Troubleshooting-Anleitungen und häufig gestellten Fragen (FAQs) bieten. Dies verbessert die Reaktionszeiten und sorgt für Konsistenz in den Kundeninteraktionen. Zudem können durch RAG unterstützte Self-Service-Portale die Kunden dazu befähigen, Probleme eigenständig zu lösen, wodurch die Belastung für die Support-Teams verringert wird. 

Compliance und Recht

In Compliance-orientierten Branchen kann RAG das Navigieren durch komplexe Vorschriften und rechtliche Dokumentationen erleichtern. Durch das Abrufen spezifischer Klauseln oder Anforderungen aus Richtliniendokumenten unterstützt RAG die Rechtsteams dabei, die Einhaltung von Vorschriften sicherzustellen und Risiken im Kontext der Nichteinhaltung zu minimieren. 

Vertrieb und Marketing

Vertriebs- und Marketingteams können RAG nutzen, um zentrale Einblicke aus Marktberichten, CRM-Daten und Wettbewerbsanalysen abzurufen. Dies erleichtert personalisierte Angebote, die schnellere Erstellung von Vorschlägen und ein tieferes Verständnis der Kundenbedürfnisse, was letztlich zu höheren Konversionsraten führt. 

Human Resources

Im Bereich HR kann RAG Prozesse wie die Beantwortung von Mitarbeiteranfragen, das Extrahieren von Informationen aus HR-Richtlinien und die Automatisierung des Onboarding-Prozesses optimieren. Durch den sofortigen Zugriff auf Unternehmensrichtlinien und Informationen zu Zusatzleistungen reduziert RAG den administrativen Aufwand und verbessert das Mitarbeitererlebnis. 

Vor- und Nachteile der Nutzung von RAG in Organisationen

Während RAG transformative Vorteile bietet, bringt es auch bestimmte Herausforderungen mit sich, die Organisationen berücksichtigen müssen. 

Vorteile

Einer der bedeutendsten Vorteile von RAG ist seine Fähigkeit, Wissen effizient abzurufen. Durch die Möglichkeit, relevante Informationen schnell zugänglich zu machen, verbessert RAG die Entscheidungsfindung und fördert informierte, datengestützte Strategien. Darüber hinaus verbessert RAG die Benutzererfahrung, indem es Interaktionen personalisiert, sei es für Kunden oder Mitarbeitende. Seine Skalierbarkeit ermöglicht es Organisationen, wachsende Dokumentationsvolumina zu bewältigen, ohne dass die Leistung beeinträchtigt wird, was es ideal für dynamische Umgebungen macht. 

Die Unterstützung für multimodale Daten—wie Texte, Bilder und Audios—erweitert die Anwendbarkeit von RAG über verschiedene Branchen hinweg. Hinzu kommt, dass Automatisierungsfunktionen repetitive Aufgaben reduzieren und es den Teams ermöglichen, sich auf wertschöpfende Tätigkeiten zu konzentrieren. 

Nachteile

Jedoch sind RAG-Systeme nur so effektiv wie die Daten, auf denen sie basieren. Minderwertige Daten können zu ungenauen oder irreführenden Ergebnissen führen, was robuste Datenmanagementpraktiken erfordert. Die anfänglichen Implementierungskosten, einschließlich der Infrastrukturkosten und des Schulungsaufwands, können hoch sein, insbesondere bei On-Premise Lösungen. Cloud-basierte Implementierungen, obwohl kostengünstig, können Risiken im Hinblick auf die Datensensibilität darstellen, speziell für Organisationen, die vertrauliche Informationen verarbeiten. 

Die Infrastrukturanforderungen für lokale Implementierungen erfordern erhebliche Investitionen in Hardware und technisches Fachwissen. Ein weiteres Anliegen ist die mangelnde Erklärbarkeit von RAG; die undurchsichtige Natur der generativen KI-Ausgaben kann es schwierig machen, deren Genauigkeit zu überprüfen. Schließlich können bei komplexen Abfragen in umfangreichen Umgebungen Latenzprobleme auftreten, die die Benutzererfahrung eventuell beeinträchtigen.

Webinar

Schneller & einfacher zum Projekterfolg mit Citizen AI

Kostenlos anmelden
Schneller & einfacher zum Projekterfolg mit Citizen AI

RAG – Technische Übersicht

Man könnte RAG als eine Black Box betrachten: Man gibt Daten ein, und es produziert magisch das gewünschte Ergebnis. Die Realität ist jedoch ganz anders. RAG ist einfach eine gut gestaltete Pipeline, die Schritte beinhaltet, in denen die Ausgabe einer LLM-Instanz als Eingabe für eine andere verwendet wird. Im Folgenden beschreibe ich einen Anwendungsfall, den ich für die cplace Dokumentation entwickelt habe. 

Schritt 1: Mit hochwertigen Daten beginnen

Die erste Anforderung sind hochwertige Daten. In der KI-Community gibt es ein populäres Sprichwort: „Garbage in, garbage out.“ Dies gilt insbesondere hier – kein LLM kann fehlende oder schlecht strukturierte Daten/Dokumentationen ausgleichen. Sobald Sie sichergestellt haben, dass Ihre Dokumentation von hoher Qualität, gut strukturiert und selbständig ist (z. B. mit sinnvollen Überschriften und klaren Abschnitten), können Sie zu den nächsten Schritten übergehen. 

Schritt 2: Zusammenfassung und Einbettung der Dokumentation

Der RAG-Prozess beginnt mit der Zusammenfassung jedes eigenständigen Dokuments. Diese Zusammenfassungen werden „eingebettet“ und zusammen mit dem vollständigen Textdokument oder einem Link dazu in einer spezialisierten Vektordatenbank gespeichert. 

Was ist eine Einbettung? Eine Einbettung ist eine numerische Darstellung der semantischen Bedeutung der Zusammenfassung. Im Gegensatz zu Keyword-basierten Suchen ermöglicht es die Verwendung von Einbettungen dem System, Dokumente basierend auf ihrer konzeptionellen Ähnlichkeit abzurufen. 

Beispiel: 

  • Suchphrase: „Wie kann ich eine neue Seite in cplace hinzufügen?“ 
  • Bester Übereinstimmungszusammenfassung: „Das Dokument dient als Benutzerhandbuch zum Erstellen von Seiten in cplace, einer kollaborativen Plattform. Es werden verschiedene Methoden zum Erstellen unterschiedlicher Seitenarten beschrieben, wobei betont wird, dass Seiten in cplace nicht auf Text- oder Wiki-Formate beschränkt sind, sondern verschiedene Instanzen darstellen können. Das Dokument schließt den Importprozess aus, …“ 

Wie Sie sehen können, ist die Übereinstimmung nicht offensichtlich und funktioniert möglicherweise nicht für jede Suchanfrage. Um dies zu verbessern, verwenden wir eine Technik namens HyDE (Hypothetical Document Embeddings). 

Schritt 3: Verwendung von HyDE für verbesserte Suchergebnisse

HyDE beinhaltet einen zusätzlichen Schritt, in dem das LLM eine hypothetische Antwort auf die Suchanfrage des Nutzers generiert. Diese generierte Antwort wird dann verwendet, um in der Vektordatenbank zu suchen und genauere Ergebnisse zu erzielen. 

Beispiel: 

  • Suchphrase: „Um eine neue Seite in cplace hinzuzufügen, navigieren Sie zum Arbeitsbereich oder Projekt, in dem die Seite erscheinen soll. Klicken Sie auf das Menüsymbol (in der Regel durch drei Punkte oder ein ‚Hamburger‘-Menü dargestellt) oder die Schaltfläche ‚Hinzufügen‘, je nach Ihrer Konfiguration …“ 
  • Beste Übereinstimmung: „Das Dokument dient als Benutzerhandbuch zum Erstellen von Seiten in cplace, …“ 

Das System kann außerdem so konfiguriert werden, dass es mehrere Dokumente zurückgibt, wenn die Anfrage einen breiteren Kontext erfordert, oder wir könnten ein weiteres Tool namens Ranker verwenden, um die besten n übereinstimmenden Dokumente auszuwählen.

Schritt 4: Vorbereitung des endgültigen Prompts

Sobald die Vektordatenbank relevante Dokumente abruft, besteht der nächste Schritt darin, einen Prompt für die endgültige LLM-Anfrage vorzubereiten. Moderne LLMs verfügen über große Kontextfenster, die es uns ermöglichen, erhebliche Mengen an Text einzugeben. Hier sind einige Tipps zur Optimierung dieses Schrittes: 

  1. Rollenvergabe: Weisen Sie das LLM an, als Fachexperte im jeweiligen Bereich zu agieren.
  1. Fokus: Geben Sie an, dass die Antwort ausschließlich auf der bereitgestellten Dokumentation beruhen soll.
  1. Kontextaufbau: Fügen Sie die abgerufene Dokumentation und die ursprüngliche Anfrage im Prompt hinzu.

Es hat sich außerdem bewährt, den Temperaturparameter angemessen einzustellen: 

  • Verwenden Sie eine hohe Temperatur für die HyDE-Generierung, um Kreativität zu fördern. 
  • Verwenden Sie eine niedrige Temperatur (z.B. 0), um die endgültige RAG-Antwort zu generieren, um Präzision und Konsistenz sicherzustellen. 

Zusätzlich sollten Links zur Quellendokumentation in der endgültigen Ausgabe enthalten sein. Dies erleichtert nicht nur das Debugging, sondern erlaubt es auch Endbenutzern, je nach Anwendungsfall eigene Recherchen durchzuführen. 

Die RAG-Pipeline: Mehr als eine einzelne Anfrage

Entgegen der Annahme ist RAG nicht eine einzige LLM-Anfrage – es handelt sich um eine Pipeline von mindestens fünf LLM-Anfragen, die stark von einer spezialisierten Vektordatenbank abhängt. Dese Schritte umfassen: 

  1. Textvorbereitung: Generierung einer Zusammenfassung jedes Dokuments.
  1. Erstellung von Einbettungen: Generierung von Zusammenfassungseinbettungen (typischerweise mit einem kleineren LLM).
  1. Generierung hypothetischer Antworten: Erstellung einer HyDE-Antwort für bessere Abfrageergebnisse.
  1. HyDE-Einbettungserstellung: Einbettung der generierten hypothetischen Antwort.
  1. Endgültige RAG-Antwort: Erstellung der endgültigen Antwort unter Verwendung des LLM mit einem großen Kontextfenster.

Durch die Kombination dieser Schritte verwandelt sich RAG von einem theoretischen Konzept in ein robustes System zur Extraktion bedeutungsvoller, kontextuell relevanter Informationen. Natürlich ist eine solche Implementierung möglicherweise nicht für jedes Szenario erforderlich, da sie mit erheblichen Rechenanforderungen verbunden ist. Bitte kontaktieren Sie uns für eine maßgeschneiderte Lösung, die am besten zu den Bedürfnissen Ihrer Organisation passt. 

Whitepaper

Wie cplace Citizen AI den Unterschied macht

Mehr erfahren
cplace Citizen AI

Implementierung von RAG innerhalb von cplace

Da cplace nicht nur eine hervorragende Wahl für die Verwaltung Ihrer Daten, sondern auch für die Pflege Ihrer Dokumentation ist, liegt die naheliegende Schlussfolgerung darin, RAG in die cplace Umgebung zu integrieren, die Ihre Organisation möglicherweise nutzt. Als Accenture haben wir bereits Erfahrung mit solchen Integrationen. 

Interaktion mit Dokumentation

RAG kann nahtlos mit in cplace erstellten Dokumentationen interagieren, indem es relevante Inhalte abruft, um den Nutzern bei der Entscheidungsfindung oder der Beantwortung von Anfragen zu helfen. Dies stellt sicher, dass Mitarbeitende Zugang zu den aktuellen und genauesten Informationen haben, was die Produktivität steigert und Fehler reduziert.

Interaktion mit Produktionsdaten

Durch die Integration von RAG mit den in cplace verwalteten Produktionsdaten können Organisationen fortgeschrittene Analysen und die Generierung von Einblicken ermöglichen. Nutzer können beispielsweise in Echtzeit Produktionsdaten zusammen mit kontextueller Dokumentation abfragen, um Prozesse zu optimieren, Engpässe zu identifizieren oder strategische Initiativen zu planen. 

Fazit

RAG stellt ein leistungsstarkes Werkzeug für Organisationen dar, die umsetzbare Erkenntnisse aus privaten Daten und Dokumentationen gewinnen möchten. Seine Fähigkeit, Abrufgenauigkeit mit generativen Fähigkeiten zu kombinieren, macht es zu einem wertvollen Asset, um Produktivität, Entscheidungsfindung und Kundenengagement zu verbessern. Es ist jedoch wichtig, sorgfältig über Datenschutz, Bereitstellungsstrategien und Implementierungs-Herausforderungen nachzudenken, um eine erfolgreiche Einführung zu gewährleisten. Plattformen wie cplace bieten mit ihrem kollaborativen und strukturierten Ansatz eine hervorragende Grundlage für die Nutzung von RAG und treiben Effizienz sowie Innovation in der heutigen datengestützten Welt voran. cplace selbst verprobt derzeit einen RAG-Ansatz, um den Nutzern zukünftig ein noch hilfreicheres Werkzeug innerhalb der cplace Knowledge Base zu bieten.

Über den Autor

Jakub Strama, Solution Architect, Accenture

Jakub Strama arbeitet als Solution Architect bei Accenture. Er hat viele Jahre Erfahrung in der Gestaltung von Web-Anwendungen und ist ein Spezialist für cplace und GenAI. Darüber hinaus fungiert er als Teamleiter und Trainer und hat einen Bachelor-Abschluss in Computing and Information Systems von der University of London. 

Zur Website von Accenture
Jakob Strama

Ähnliche Beiträge

Alle Beiträge

Erhalten Sie die neuesten Blogartikel direkt in Ihr Postfach!

Jetzt Newsletter abonnieren

Sind Sie bereit, das Projekt- und Portfoliomanagement zu revolutionieren?

Die Softwarelösung für Projekt- und Portfoliomanagement