01 / CORE · Депозитарий персональных данных

Все ПДн в одном защищённом хранилище.
Приложения работают с токенами.

Вместо того чтобы реплицировать паспорта, телефоны и адреса по 40 системам — они живут в одном депозитарии. CRM, биллинг, BI, логи, бэкапы обмениваются детерминированными токенами. Оригинальные данные никогда не покидают vault без аудитного следа.

AES-256-GCMHSM-readyRBACOn-prem или cloudp99 < 12 мс
POST api.datum.ru/v1/tokenize
› live · детерминированная токенизацияp99 < 12ms

ПДн размазаны по десяткам систем —
и каждая в скоупе 152-ФЗ.

Один телефон клиента лежит в CRM, биллинге, поддержке, BI, логах и трёх поколениях бэкапов. Каждая копия — потенциальная утечка. Каждое место — отдельный аудит.

Депозитарий Datum инвертирует задачу. ПДн хранятся в одном месте — в защищённом контуре с HSM, аудитом и строгим RBAC. Во все остальные системы вы кладёте токен — не-обратимый идентификатор, который можно хранить, передавать, джойнить и анализировать, но из которого нельзя восстановить исходные данные без явного разрешения и аудита.

До DatumС Datum
Где живут ПДн40+ систем1 депозитарий
Скоуп 152-ФЗвся инфраструктура1 компонент
Бэкапы содержат ПДнданет
Аналитика видит ПДнданет
DSR (удаление по запросу субъекта)ручной обход всех систем1 вызов API
Утечка из CRMинцидент, ПДнтолько токены

Один API,
три операции,
полный аудит.

Слева — ваши системы. В центре — Datum API. Справа — vault. Синие линии — токены, свободно ходят по инфре. Белые — ПДн, только между API и vault, каждое обращение записывается.

ВАШИ СИСТЕМЫ CRM · Продажи Биллинг Аналитика · BI Логи · бэкапы DATUM · API tokenize() detokenize() audit() token → ← PII (audited) VAULT · 152-ФЗ SCOPE AES-256-GCM · HSM On-prem / VPC / Cloud
01 / onboarding

Подключение SDK

API-ключ на staging, одна библиотека (datum-sqlalchemy, datum-django, @datum/node). Первый токен — через 20 минут после первого коммита.

02 / tokenize

Tokenize на входе

Когда новая запись попадает в систему, приложение вызывает POST /v1/tokenize с ПДн-полями. Datum возвращает токены той же семантики (тот же домен, тот же формат — детерминированно).

03 / work

Работа с токенами

В БД приложения лежат токены. SQL, джойны, поиск по телефону — всё работает, потому что одинаковый вход даёт одинаковый токен. Аналитика строит метрики на токенах. LLM — через AI Proxy.

04 / detokenize

Detokenize по необходимости

Когда оператору нужно увидеть ПДн, приложение вызывает POST /v1/detokenize с причиной. Datum возвращает данные и пишет аудит: кто, когда, зачем, IP.

05 / audit

Audit & RBAC

В дашборде — сколько токенов создано, кто что детокенизировал, аномалии в паттернах. Append-only лог, соответствие требованиям УЗ-1/УЗ-2.

Infrastructure-grade
компоненты, готовые к проду.

Шифрование, HSM-интеграция, детерминированные токены, RBAC, append-only audit, webhooks. Всё, что нужно CTO для подписания архитектурного меморандума.

01
AES-256-GCM + HSM
Per-tenant encryption keys. Master-key в HashiCorp Vault Transit или внешний HSM (Thales, Yubico). Ключи никогда не покидают HSM в plaintext.
02
Детерминированная токенизация
Одинаковые ПДн → одинаковый токен. JOIN по phone_token работает, SELECT DISTINCT работает, поиск дубликатов — без де-токенизации.
03
Format-preserving tokens
Токен номера карты — 16 цифр. Токен email — выглядит как email. Валидаторы, regex, маски в UI продолжают работать.
04
Subject-ID tracking
Каждый токен привязан к subject_id. Один API-вызов — удалить все ПДн одного субъекта (DSR / right-to-erasure).
05
Custom fields & типы
PII-поля определяются в дашборде: phone, email, passport, bank_card, address, medical_record, custom. Свой формат токена и правила.
06
Append-only audit log
Все операции пишутся неизменяемо, подписаны HMAC. Экспорт в SIEM (Splunk, ELK) из коробки.
07
RBAC + API keys
Ключи с scope: tokenize-only, search-only, admin. IP-allowlist. Rate-limits per key.
08
Escrow & восстановление
Зашифрованный бэкап ключами клиента. В случае катастрофы — self-service восстановление без участия Datum.
09
Webhooks & events
Подписка: token.created, token.detokenized, subject.deleted, audit.anomaly.

Production-ready.
Без сюрпризов в проде.

Приведены цифры, которые проверяют CTO на первой же встрече: latency, throughput, HA, data residency.

ШифрованиеAES-256-GCM (per-tenant DEK через Vault Transit)
КлючиHashiCorp Vault / внешний HSM / локальный fallback
ПротоколыREST (JSON), gRPC, GraphQL
Latency p50/p994 мс / 12 мс (localhost); +~100 мс RTT
Throughput230+ ops/s на tokenize · 300+ ops/s на detokenize
Bulk endpointPOST /v1/bulk/tokenize — до 1000 записей/запрос
SDKPython (sync + async), Node.js, Java, Go
ORM интеграцииSQLAlchemy, Django ORM, Prisma, Sequelize
Data residencyRF (Selectel Moscow) · EU (OVH France) · on-prem
High availabilityActive-active PostgreSQL, Redis Sentinel, Vault HA
Compliance152-ФЗ · ФСТЭК УЗ-1/УЗ-2 · GDPR · SOC 2 Type II
python · datum-sqlalchemy
# drop-in замена для SQLAlchemy from datum_sqlalchemy import Tokenized from sqlalchemy import Column, String class Contact(Base): id = Column(Integer, primary_key=True) name = Column(String) phone = Column(String, Tokenized()) email = Column(String, Tokenized()) # остальной код приложения не меняется. # SELECT по phone, WHERE email=... — # работают через токены.

Уже работает
в продакшне у реальных команд.

Четыре характерных паттерна — от legacy-миграции до многосистемной архитектуры под жёсткий регулятор.

Банк

CRM + биллинг + антифрод

17 систем, один клиент. До Datum — 17 копий в скоупе. После: депозитарий + токены во всех 17. Антифрод-модель получает phone_token и находит паттерны — детерминированность сохраняет feature engineering.

Маркетплейс

Аналитика + LLM

100М+ контактов в BigQuery. Передавать ПДн в BI нельзя — команда аналитики не в скоупе 152-ФЗ. Токенизируем при ETL, когорты строятся на токенах, точечная детокенизация — через прокси.

Медтех

Электронные карты

Самый строгий сценарий — УЗ-1 + специальные категории ПДн. Datum on-prem с внешним HSM. Врач видит карту через приложение, депозитарий логирует каждое чтение. ЕГИСЗ получает только положенное.

E-commerce

Legacy-миграция

PostgreSQL с 15М заказов. Один ALTER TABLE + bulk tokenize за ночь — и вся БД выходит из скоупа 152-ФЗ. Zero downtime: колонка добавляется nullable, скрипт токенизирует, старая дропается.

От API-ключа
до прода — две недели.

Интеграция не требует переписывания бизнес-логики. Shadow-mode даёт возможность откатиться на любом этапе.

День 1 · SANDBOX

API-ключ и SDK

Ключ на staging (staging.pdncloud.ru). pip install datum-sqlalchemy. Первый POST /v1/tokenize — через 20 минут. Токены видны в дашборде.

Неделя 1 · SHADOW

Shadow mode

Помечаете PII-колонки Tokenized(). Новые записи пишутся в raw + токен. Проверяем, что JOIN'ы и поиск работают. Raw-колонка пока есть — можно откатиться.

Неделя 2 · CUTOVER

Переключение

Bulk-токенизация исторических данных (фоном). Переключение чтения на токены. Drop raw-колонок. DELETE FROM vault WHERE subject_id = X чистит старые снапшоты.

Частые вопросы от CTO.

Если вашего вопроса нет — напишите sales@datumcloud.ru, ответим в течение рабочего дня.

Что если Datum упадёт — мы потеряем данные?

Нет. Vault-данные реплицируются в PostgreSQL HA-кластере с WAL-бэкапом. Плюс escrow — зашифрованный бэкап у вас, расшифровываемый вашим ключом. Даже если Datum-сервис недоступен, ваши данные восстанавливаемы без нас.

Я не хочу отдавать вам ключи шифрования.

Правильно — и не надо. В on-prem-варианте HashiCorp Vault (или ваш HSM) живёт в вашем контуре, ключи не покидают ваш периметр. Мы поставляем сервис и админку; ключи — ваши.

Работает ли это с нашей legacy-БД и стейджем Django/Rails/Java?

Да. SDK под Python (SQLAlchemy, Django), Node (Prisma, Sequelize), Java (JDBC интерсептор), Go. Миграция legacy — через ALTER TABLE ADD COLUMN phone_token + batch-скрипт. Паттерн отработан.

Производительность — каждый запрос HTTP-hop?

Детокен-запросы кешируются в Redis на стороне клиента (зашифрованные). Hot tokens → <1 мс. Cold — <12 мс p99. Для миграции 15M записей — bulk endpoint со скоростью ~10k ops/s.

Где хранятся данные — законно ли для 152-ФЗ?

Datum RU — Selectel Moscow, полностью в РФ. Данные не покидают территорию. ФЗ-242 выполнен.

Сколько это стоит?

По объёму операций, не по записям. Pricing — по запросу. Есть free tier для PoC (100k ops/месяц).

Посмотрим, как депозитарий
встанет в вашу инфраструктуру.

30 минут с архитектором. Разбираем, какие системы в скоупе, показываем SDK под ваш стек, оцениваем сроки миграции.

sales@datumcloud.ruМосква · Санкт-Петербург
Запросить демо · Депозитарий
Отвечаем в течение рабочего дня. Ваши данные обрабатываются в соответствии с 152-ФЗ — собственно, тем, что мы и делаем.
DATUM
© 2026 Datum · ПДн инфраструктура