Логотип ГардаЛоготип Гарда

Безликие и бесценные: маскирование данных

Как предотвратить утечку конфиденциальных данных, передавая их сторонней организации: внешнему подрядчику, аудитору, аналитической службе и т.д. — сценариев, предполагающих такую необходимость, довольно много. При этом в подавляющем большинстве ситуаций сам характер задачи требует того, чтобы данные были консистентны и максимально правдоподобны.

06.08.2024

Содержание

Методы маскирования данных
Статическое и динамическое маскирование данных
Подписаться на рассылку
Отправьте заявку

Так, например, один из наиболее частых и показательных кейсов — разработка, тестирование, отладка, поддержка и развитие информационных систем или иного прикладного ПО в парадигме DevOps. Очевидно, что в интересах заказчика — предоставить исполнителю реальные или по крайней мере как можно более реалистичные данные — только так он сможет в кратчайшие сроки получить то, что ему нужно, и избежать расходов на доработку, а также иных сопутствующих издержек и неудобств.

Однако, передавая реальные данные вовне, компания фактически утрачивает контроль над ними, а это чрезвычайно рискованно: порядка 20% от общего количества утечек происходят именно на стороне подрядчика, такова статистика. Кроме того, существуют и жесткие требования законодательства в области защиты данных, пренебрежение которыми чревато неиллюзорными неприятностями. Выход из ситуации — маскирование данных.

Суть операции — подмена реальных данных фиктивными значениями или набором произвольных символов. Результаты такого преобразования могут быть разными в зависимости от метода обезличивания данных. Выбор того или иного метода маскирования определяется характером задачи, т.е. тем, в какой мере необходимо сохранить целостность и внутреннюю непротиворечивость исходных данных для дальнейшего использования. Рассмотрим вкратце основные способы маскирования данных. На практике, как правило, их комбинируют.

Методы маскирования данных

Все знают, что при операциях с платежными картами в онлайн-сервисах видны только последние четыре цифры, остальные — скрыты иксами. Так работает самый простой метод: необходимое количество символов в нужных позициях исходной записи заменяется звездочками, нулями (обнуление) и т.д. Несмотря на существенные недостатки и ограниченную пригодность для дальнейшего использования в большинстве случаев, метод широко применяется в биллинговых сценариях и позволяет маскировать данные в режиме реального времени.

Замена — метод, позволяющий в той или иной мере сохранить целостность данных в базе благодаря тому, что заменяемые данные как минимум по типу, а в продвинутой версии — и семантически соответствуют результирующим. Самый простой вариант — статическая замена: вместо всех исходных значений подставляется одинаковое значение с тем же типом данных. Например, во все текстовые поля столбца с фамилиями проставляется запись «персональные данные». В обоих случаях это символьные строки, тип данных одинаковый, но семантика утрачена.

Если важно сохранить и то, и другое, нужна псевдонимизация — замена данных на аналогичные, причем отвечающие заданным критериями. Например, вместо мужского имени должно подставляться именно мужское, а не женское; номер платежной карты должен проходить проверку на валидность по определенному алгоритму и т.д. Для псевдонимизации требуются готовые наборы данных для подстановки.

Также можно в пределах каждого столбца перетасовать данные во всей исходной таблице — это популярный метод маскирования данных, который обычно применяется как дополнительная мера защиты, поскольку сам по себе недостаточно надежен и принципиально обратим. Еще один доступный вариант — замена данных на случайные, но реалистичные значения, например, 16 любых цифр вместо номера платежной карты. На первый взгляд результат неотличим от реального, т.к. соблюдено условие по количеству символов, и эти символы — цифры.

Для маскирования числовых значений и дат применяются методы, влияющие на точность данных. С помощью числовой дисперсии можно варьировать исходные значения в пределах заданного диапазона отклонений, например, ±15%, а обобщение и вовсе заменяет конкретное число или дату на диапазон.

Статическое и динамическое маскирование данных

Статическое маскирование — это обезличивание данных при создании их копии. Результат — копия базы данных или ее фрагмента, где вся конфиденциальная информация либо удалена, либо замаскирована. Такую копию можно спокойно передавать внешним исполнителям. Статическое маскирование выполняется на выделенном сервере или виртуальной машине, где развернута система обезличивания данных.

Динамическое маскирование данных происходит непосредственно в процессе их передачи от источника к получателю, без промежуточного этапа создания копии данных, изменения нигде не фиксируются. Динамическое маскирование может быть реализовано путем развертывания ПО для обработки данных на отдельном сервере, либо непосредственно на сервере приложения, если используется трехзвенная архитектура.

Также с его помощью удобно разграничивать доступ пользователей базы данных к конфиденциальной информации, предоставляя реальную информацию только определенным категориям пользователей и только в том объеме, который необходим им для работы.

Современные автоматизированные системы обезличивания данных от зарекомендовавших себя на рынке ИБ разработчиков способны самостоятельно выполнять поиск конфиденциальной информации. Они позволяют гибко настраивать параметры, создавать собственные правила маскирования, а также сохранять взаимосвязь между теми или иными данными и сущностями. При этом такие системы высокопроизводительны, просты в использовании и легко масштабируются, что выгодно отличает их от существующих open-source решений. Яркий пример подобной коммерческой платформы — «Гарда Маскирование».

«Гарда Маскирование» — система обезличивания данных в СУБД для безопасной работы с ними. Система выявляет и маскирует чувствительные данные, реплицирует базы данных с полным сохранением их структуры и взаимосвязей, заменяет чувствительную информацию в соответствии с требованиями регуляторов.

Подписаться на рассылку

Отправьте заявку

Рассчитайте стоимость решения для своей компании