Zur Sicherstellung von Enterprise-AI-Agenten vor der Bereitstellung: Ontologie-basierte Simulation und Vertrauenszertifizierung
· Quelle: arXiv cs.AI
Die vor der Implementierung von Agenten der künstlichen Intelligenz (KI) in Unternehmen durchzuführende Überprüfung bleibt eine kritische Lücke zwischen der Bewertung der Fähigkeiten der Sprachmodelle und ihrem Einsatz in der Produktion. Die nach der Implementierung durchgeführte Überwachung und die Sicherheitskontrollen bieten nur eine begrenzte Garantie, sobald der Agent in Betrieb ist. Um dieses Problem anzugehen, wird ein Rahmen für die Überprüfung vorgeschlagen, der auf Ontologien basiert und drei Komponenten kombiniert: ein formalisiertes Zertifizierungsraum, ein Szenariogenerierungs-Pipeline und ein Vertrauenszertifikat mit einem maschinell verifizierbaren Zeugnis. Ein kontrolliertes Pilotstudium in vier regulierten Branchen (Fintech, Banken, Versicherungen und Gesundheitswesen) erzeugte 1.800 Bewertungsszenarien, die gegen 125 regulatorische Anforderungen und 25 eingefügte Fehler ausgewertet wurden. Die auf Ontologien basierende Generierung erreichte eine regulatorische Abdeckung von 48,3 %, im Vergleich zu 33,1 % des auf Personen basierenden Ansatzes. Dies zeigt, dass die auf Ontologien basierende Szenariogenerierung ein überzeugendes Komplement zu den von Menschen durchgeführten Tests in regulatorisch intensiven Domänen ist. Diese Nachricht ist wichtig, da sie die Notwendigkeit hervorhebt, die Sicherheit und Zuverlässigkeit von KI-Agenten in Unternehmen zu gewährleisten, und wie Lösungen wie die auf Ontologien basierende Szenariogenerierung diesem Herausforderung begegnen können. Darüber hinaus ist es im Kontext der Anwendung von KI im Handel von entscheidender Bedeutung, vertrauenswürdige und sichere Lösungen wie die, die dataqbs in seiner Open-Garage-Plattform entwickelt, zu haben.
Originalartikel lesen auf arXiv cs.AI
Diese Zusammenfassung ist eine informationelle Synthese von dataqbs.com. Alle Rechte am Originalinhalt liegen beim Autor und dem genannten Medienunternehmen. Wir handeln ausschließlich als Kuratoren von Technologie-Nachrichten und beanspruchen keine Urheberschaft.