Агент искусственного интеллекта

Безопасная эксплуатация

Безопасность больших моделей: введение и анализ открытого фреймворка Guardrails security fence

OpenGuardrails - это первая полная платформа безопасности с открытым исходным кодом корпоративного уровня, поддерживающая 119 языков, унифицированную архитектуру LLM, настраиваемые политики чувствительности и развертывание в нескольких облаках. В этом отчете представлен глубокий анализ основных технических инноваций, сценариев применения, моделей развертывания, сравнительного анализа производительности и будущего развития, а также рекомендации по обеспечению соответствия требованиям безопасности для приложений искусственного интеллекта в регулируемых отраслях, таких как финансы, здравоохранение и юриспруденция. Анализируя настраиваемые политики OpenGuardrails, эффективную модель и инфраструктуру производственного уровня, авторы раскрывают направление развития следующего поколения ИИ-систем безопасности.

xbear
Письмо от 6 января 2026 года от Постоянного представителя
08.7K01
Безопасная эксплуатация

CSO: Руководство для директора по безопасности по полной защите данных искусственного интеллекта

Руководители служб безопасности (CSO) столкнулись с беспрецедентной проблемой: системы искусственного интеллекта как усиливают существующие риски, связанные с данными, так и создают совершенно новые угрозы, такие как отравление данных, реинжиниринг моделей и заражение цепочки поставок. Данное руководство опирается на NIST AI Risk Management Framework (AI RMF), Google Secure AI Framework (SAIF) и отраслевые практики, чтобы предоставить CSO действенную систему управления безопасностью данных.

главный офицер безопасности
31 декабря 2025 года
06,1 тыс.00
Анализ уязвимостей

AI Intelligence Body Security: Уязвимость GitHub Actions Prompt Word Injection (PromptPwnd)

PromptPwnd - это новая уязвимость, обнаруженная исследовательской группой Aikido Security, которая представляет серьезную угрозу для CI/CD конвейеров GitHub Actions и GitLab, в которые интегрированы агенты искусственного интеллекта. Уязвимость использует Prompt Injection для компрометации ключей, манипулирования рабочими процессами и нарушения цепочки поставок путем введения вредоносных команд в модель искусственного интеллекта, заставляя ее выполнять операции с высокими привилегиями. Уязвимость затронула по меньшей мере пять компаний из списка Fortune 500, а также несколько известных проектов, таких как Google Gemini CLI.

главный офицер безопасности
Письмо министра иностранных дел Соединенного Королевства Великобритании и Северной Ирландии от 27 декабря 2025 года
05.5K00
Безопасная эксплуатация

Взлом ИИ: автоматизированный анализ проникновения агентов ИИ

Strix представляет собой смену парадигмы в области тестирования кибербезопасности - эволюцию от подхода, ориентированного на ручное проникновение, к многоагентной модели совместной автоматизации. Инструмент обеспечивает полное управление жизненным циклом уязвимости (разведка, эксплуатация, проверка) с помощью автономных интеллектов, управляемых LLM, демонстрируя значительные преимущества по стоимости (снижение затрат более чем на 70%) и по времени (циклы тестирования сократились с недель до часов) по сравнению с традиционными инструментами ручного проникновения и пассивного сканирования. Однако не менее очевидны и его ограничения: успешность эксплуатации уязвимостей "нулевого дня" составляет всего 10-12%, возможности обнаружения уязвимостей бизнес-логики крайне недостаточны, а присущие мультиагентным системам риски безопасности (инъекции подсказок, злоупотребление доверием между агентами) требуют структурированной системы управления.

Лион
24 декабря 2025 г.
07.6K00
сбор разведданных

Релиз OWASP: ИИ-интеллект в теле безопасности OWASP Top 10 2026

По мере эволюции ИИ от простых чатботов до агентного ИИ с автономными возможностями планирования, принятия решений и исполнения, поверхность атаки приложений кардинально изменилась. В отличие от традиционных LLM ...

главный офицер безопасности
22 декабря 2025 г.
010,6 тыс.03

Агент искусственного интеллекта

Безопасность больших моделей: введение и анализ открытого фреймворка Guardrails security fence

CSO: Руководство для директора по безопасности по полной защите данных искусственного интеллекта

AI Intelligence Body Security: Уязвимость GitHub Actions Prompt Word Injection (PromptPwnd)

Взлом ИИ: автоматизированный анализ проникновения агентов ИИ

Релиз OWASP: ИИ-интеллект в теле безопасности OWASP Top 10 2026