dataqbs

AgentWall: Ein Laufzeit-Sicherheitslayer für lokale AI-Agenten

· Quelle: arXiv cs.AI

Die Sicherheit autonomer künstlicher Intelligenz-Agenten ist ein kritischer Problem, das zunehmend an Bedeutung gewinnt. Mit der Entwicklung dieser Agenten von passiven Textgeneratoren zu aktiven Akteuren, die Befehle ausführen, Dateien ändern, APIs aufrufen und durch die Web navigieren können, werden die Folgen unsicherer oder manipulierter Verhaltensweisen sofort und greifbar. Die bestehende Forschung in der Sicherheit von künstlicher Intelligenz hat sich hauptsächlich auf die Ausrichtung von Modellen und die Filterung von Eingaben konzentriert, aber diese Ansätze erfassen nicht, was passiert, wenn die Absicht eines Agenten in eine reale Aktion in einer realen Maschine umgewandelt wird. Um diese Lücke zu schließen, wurde AgentWall entwickelt, eine Sicherheits- und Beobachtungsschicht in Echtzeit für lokale künstliche Intelligenz-Agenten. AgentWall fängt jede von einem Agenten vorgeschlagene Aktion ab, bevor sie den Host-Umgebung erreicht, bewertet sie gegen eine explizite deklarative Politik und erfordert menschliche Genehmigung für sensible Operationen. Dies ermöglicht eine genauere Kontrolle über die Aktionen der Agenten und reduziert das Risiko unsicherer Verhaltensweisen. Die Bedeutung dieser Nachricht liegt darin, dass die Sicherheit von künstlicher Intelligenz-Agenten für die Gewährleistung der Vertrauenswürdigkeit der Technologie und die Verhinderung möglicher Schäden von entscheidender Bedeutung ist. Die Fähigkeit, die Aktionen von künstlicher Intelligenz-Agenten zu steuern und zu überwachen, ist für ihre sichere Einführung in lokalen und betrieblichen Umgebungen von entscheidender Bedeutung.

Originalartikel lesen auf arXiv cs.AI

Diese Zusammenfassung ist eine informationelle Synthese von dataqbs.com. Alle Rechte am Originalinhalt liegen beim Autor und dem genannten Medienunternehmen. Wir handeln ausschließlich als Kuratoren von Technologie-Nachrichten und beanspruchen keine Urheberschaft.

Lesen Sie dies auf Español