Агент искусственного интеллекта

  • Безопасность больших моделей: введение и анализ открытого фреймворка Guardrails security fence

    OpenGuardrails - это первая полная платформа безопасности с открытым исходным кодом корпоративного уровня, поддерживающая 119 языков, унифицированную архитектуру LLM, настраиваемые политики чувствительности и развертывание в нескольких облаках. В этом отчете представлен глубокий анализ основных технических инноваций, сценариев применения, моделей развертывания, сравнительного анализа производительности и будущего развития, а также рекомендации по обеспечению соответствия требованиям безопасности для приложений искусственного интеллекта в регулируемых отраслях, таких как финансы, здравоохранение и юриспруденция. Анализируя настраиваемые политики OpenGuardrails, эффективную модель и инфраструктуру производственного уровня, авторы раскрывают направление развития следующего поколения ИИ-систем безопасности.

    Письмо от 6 января 2026 года от Постоянного представителя
    06.6K0
  • CSO: Руководство для директора по безопасности по полной защите данных искусственного интеллекта

    Руководители служб безопасности (CSO) столкнулись с беспрецедентной проблемой: системы искусственного интеллекта как усиливают существующие риски, связанные с данными, так и создают совершенно новые угрозы, такие как отравление данных, реинжиниринг моделей и заражение цепочки поставок. Данное руководство опирается на NIST AI Risk Management Framework (AI RMF), Google Secure AI Framework (SAIF) и отраслевые практики, чтобы предоставить CSO действенную систему управления безопасностью данных.

    31 декабря 2025 года
    05,3 тыс.0
  • AI Intelligence Body Security: Уязвимость GitHub Actions Prompt Word Injection (PromptPwnd)

    PromptPwnd - это новая уязвимость, обнаруженная исследовательской группой Aikido Security, которая представляет серьезную угрозу для CI/CD конвейеров GitHub Actions и GitLab, в которые интегрированы агенты искусственного интеллекта. Уязвимость использует Prompt Injection для компрометации ключей, манипулирования рабочими процессами и нарушения цепочки поставок путем введения вредоносных команд в модель искусственного интеллекта, заставляя ее выполнять операции с высокими привилегиями. Уязвимость затронула по меньшей мере пять компаний из списка Fortune 500, а также несколько известных проектов, таких как Google Gemini CLI.

    Письмо министра иностранных дел Соединенного Королевства Великобритании и Северной Ирландии от 27 декабря 2025 года
    04,4К0
  • Взлом ИИ: автоматизированный анализ проникновения агентов ИИ

    Strix представляет собой смену парадигмы в области тестирования кибербезопасности - эволюцию от подхода, ориентированного на ручное проникновение, к многоагентной модели совместной автоматизации. Инструмент обеспечивает полное управление жизненным циклом уязвимости (разведка, эксплуатация, проверка) с помощью автономных интеллектов, управляемых LLM, демонстрируя значительные преимущества по стоимости (снижение затрат более чем на 70%) и по времени (циклы тестирования сократились с недель до часов) по сравнению с традиционными инструментами ручного проникновения и пассивного сканирования. Однако не менее очевидны и его ограничения: успешность эксплуатации уязвимостей "нулевого дня" составляет всего 10-12%, возможности обнаружения уязвимостей бизнес-логики крайне недостаточны, а присущие мультиагентным системам риски безопасности (инъекции подсказок, злоупотребление доверием между агентами) требуют структурированной системы управления.

    24 декабря 2025 г.
    06.3K0
  • Релиз OWASP: ИИ-интеллект в теле безопасности OWASP Top 10 2026

    По мере эволюции ИИ от простых чатботов до агентного ИИ с автономными возможностями планирования, принятия решений и исполнения, поверхность атаки приложений кардинально изменилась. В отличие от традиционных LLM ...