Агент искусственного интеллекта
-
大模型安全:开源框架Guardrails安全护栏介绍与解析
OpenGuardrails是首个完整开源的企业级大模型安全护栏平台,支持119种语言、统一LLM架构、可配置敏感度策略、多云部署。本报告深度解析其核心技术创新、应用场景、部署模式、性能对标与未来发展,为金融、医疗、法律等受管制行业的AI应用提供安全合规指引。通过分析OpenGuardrails的可配置策略、高效模型设计与生产级基础设施,揭示下一代AI安全护栏的发展方向。
-
CSO: Руководство для директора по безопасности по полной защите данных искусственного интеллекта
Руководители служб безопасности (CSO) столкнулись с беспрецедентной проблемой: системы искусственного интеллекта как усиливают существующие риски, связанные с данными, так и создают совершенно новые угрозы, такие как отравление данных, реинжиниринг моделей и заражение цепочки поставок. Данное руководство опирается на NIST AI Risk Management Framework (AI RMF), Google Secure AI Framework (SAIF) и отраслевые практики, чтобы предоставить CSO действенную систему управления безопасностью данных.
-
AI Intelligence Body Security: Уязвимость GitHub Actions Prompt Word Injection (PromptPwnd)
PromptPwnd - это новая уязвимость, обнаруженная исследовательской группой Aikido Security, которая представляет серьезную угрозу для CI/CD конвейеров GitHub Actions и GitLab, в которые интегрированы агенты искусственного интеллекта. Уязвимость использует Prompt Injection для компрометации ключей, манипулирования рабочими процессами и нарушения цепочки поставок путем введения вредоносных команд в модель искусственного интеллекта, заставляя ее выполнять операции с высокими привилегиями. Уязвимость затронула по меньшей мере пять компаний из списка Fortune 500, а также несколько известных проектов, таких как Google Gemini CLI.
-
Взлом ИИ: автоматизированный анализ проникновения агентов ИИ
Strix представляет собой смену парадигмы в области тестирования кибербезопасности - эволюцию от подхода, ориентированного на ручное проникновение, к многоагентной модели совместной автоматизации. Инструмент обеспечивает полное управление жизненным циклом уязвимости (разведка, эксплуатация, проверка) с помощью автономных интеллектов, управляемых LLM, демонстрируя значительные преимущества по стоимости (снижение затрат более чем на 70%) и по времени (циклы тестирования сократились с недель до часов) по сравнению с традиционными инструментами ручного проникновения и пассивного сканирования. Однако не менее очевидны и его ограничения: успешность эксплуатации уязвимостей "нулевого дня" составляет всего 10-12%, возможности обнаружения уязвимостей бизнес-логики крайне недостаточны, а присущие мультиагентным системам риски безопасности (инъекции подсказок, злоупотребление доверием между агентами) требуют структурированной системы управления.
-
Релиз OWASP: ИИ-интеллект в теле безопасности OWASP Top 10 2026
По мере эволюции ИИ от простых чатботов до агентного ИИ с автономными возможностями планирования, принятия решений и исполнения, поверхность атаки приложений кардинально изменилась. В отличие от традиционных LLM ...