Все знают, что при операциях с платежными картами в онлайн-сервисах видны только последние четыре цифры, остальные —
скрыты иксами. Так работает самый простой метод: необходимое количество символов в нужных позициях исходной записи
заменяется звездочками, нулями (обнуление) и т.д. Несмотря на существенные недостатки и ограниченную пригодность для
дальнейшего использования в большинстве случаев, метод широко применяется в биллинговых сценариях и позволяет
маскировать данные в режиме реального времени.
Замена — метод, позволяющий в той или иной мере сохранить целостность данных в базе благодаря тому, что заменяемые
данные как минимум по типу, а в продвинутой версии — и семантически соответствуют результирующим. Самый простой
вариант — статическая замена: вместо всех исходных значений подставляется одинаковое значение с тем же типом данных.
Например, во все текстовые поля столбца с фамилиями проставляется запись «персональные данные». В обоих случаях это
символьные строки, тип данных одинаковый, но семантика утрачена.
Если важно сохранить и то, и другое, нужна псевдонимизация — замена данных на аналогичные, причем отвечающие заданным
критериями. Например, вместо мужского имени должно подставляться именно мужское, а не женское; номер платежной карты
должен проходить проверку на валидность по определенному алгоритму и т.д. Для псевдонимизации требуются готовые наборы
данных для подстановки.
Также можно в пределах каждого столбца перетасовать данные во всей исходной таблице — это популярный метод
маскирования данных, который обычно применяется как дополнительная мера защиты, поскольку сам по себе недостаточно
надежен и принципиально обратим. Еще один доступный вариант — замена данных на случайные, но реалистичные значения,
например, 16 любых цифр вместо номера платежной карты. На первый взгляд результат неотличим от реального, т.к.
соблюдено условие по количеству символов, и эти символы — цифры.
Для маскирования числовых значений и дат применяются методы, влияющие на точность данных. С помощью числовой
дисперсии можно варьировать исходные значения в пределах заданного диапазона отклонений, например, ±15%, а обобщение и
вовсе заменяет конкретное число или дату на диапазон.
Поделиться: