AI-Agent
-
大模型安全:开源框架Guardrails安全护栏介绍与解析
OpenGuardrails是首个完整开源的企业级大模型安全护栏平台,支持119种语言、统一LLM架构、可配置敏感度策略、多云部署。本报告深度解析其核心技术创新、应用场景、部署模式、性能对标与未来发展,为金融、医疗、法律等受管制行业的AI应用提供安全合规指引。通过分析OpenGuardrails的可配置策略、高效模型设计与生产级基础设施,揭示下一代AI安全护栏的发展方向。
-
CSO: Ein Leitfaden für Chief Security Officer zur vollständigen Sicherheit von KI-Daten
Chief Security Officers (CSOs) stehen vor einer noch nie dagewesenen Herausforderung: KI-Systeme verstärken sowohl bestehende Datenrisiken als auch völlig neue Bedrohungen wie Data Poisoning, Model Reverse Engineering und Kontamination der Lieferkette. Dieser Leitfaden baut auf dem NIST AI Risk Management Framework (AI RMF), dem Google Secure AI Framework (SAIF) und Branchenpraktiken auf, um CSOs ein umsetzbares System zur Datensicherheitssteuerung an die Hand zu geben.
-
AI Intelligence Body Security: GitHub Actions Prompt Word Injection (PromptPwnd) Sicherheitslücke
PromptPwnd ist eine neue Schwachstelle, die vom Aikido Security-Forschungsteam entdeckt wurde und eine ernsthafte Bedrohung für GitHub Actions und GitLab CI/CD-Pipelines darstellt, die KI-Agenten integrieren. Die Schwachstelle nutzt Prompt Injection aus, um Schlüssel zu kompromittieren, Arbeitsabläufe zu manipulieren und die Lieferkette zu gefährden, indem böswillige Befehle in ein KI-Modell injiziert werden, die es veranlassen, Operationen mit hohen Rechten durchzuführen. Mindestens fünf Fortune-500-Unternehmen sind von der Schwachstelle betroffen, und bei mehreren hochkarätigen Projekten wie Google Gemini CLI wurde die Schwachstelle nachgewiesen.
-
AI-Hacking: Automatisierte Infiltrationsanalyse von AI-Agenten
Strix stellt einen Paradigmenwechsel im Bereich der Cybersicherheitstests dar - eine Entwicklung von einem manuell-zentrierten Penetrationsansatz zu einem kollaborativen Automatisierungsmodell mit mehreren Agenten. Das Tool ermöglicht ein komplettes Schwachstellen-Lebenszyklusmanagement (Erkundung, Ausnutzung, Validierung) durch LLM-gesteuerte autonome Intelligenz und weist im Vergleich zu herkömmlichen manuellen Penetrations- und passiven Scanning-Tools erhebliche Kostenvorteile (Kostenreduzierung um mehr als 70%) und Zeiteffizienzvorteile (von Wochen auf Stunden reduzierte Testzyklen) auf. Ihre Grenzen sind jedoch ebenso offensichtlich: Die Erfolgsquote bei der Ausnutzung von Zero-Day-Schwachstellen beträgt nur 10-12%, die Fähigkeit zur Erkennung von Schwachstellen in der Geschäftslogik ist völlig unzureichend, und die inhärenten Sicherheitsrisiken von Multi-Agenten-Systemen (Hint Injection, Vertrauensmissbrauch zwischen Agenten) erfordern einen strukturierten Governance-Rahmen.
-
OWASP-Veröffentlichung: KI-Intelligenz Körperschutz OWASP Top 10 2026
Da sich KI von reinen Chatbots zu agentenbasierter KI mit autonomen Planungs-, Entscheidungs- und Ausführungsfunktionen entwickelt, hat sich die Angriffsfläche von Anwendungen grundlegend verändert. Im Gegensatz zu traditionellen LLM ...