Bỏ qua nội dung

1. Đề xuất kiến trúc

Tóm tắt điều hành

Tài liệu này trình bày một hướng tiếp cận thực dụng để bảo vệ dữ liệu cá nhân (PII) của khách hàng, thiết kế cho bối cảnh một doanh nghiệp bán lẻ/TMĐT với hơn một triệu bản ghi khách hàng và mục tiêu trọng tâm là chống rò rỉ dữ liệu cũng như truy được nguồn khi sự cố xảy ra.

Khác với phương án xây dựng một PII Vault hoàn chỉnh (tốn kém, rủi ro cao, thời gian dài) hay mua một sản phẩm thương mại (chi phí license, phụ thuộc nhà cung cấp), hướng kết hợp này tận dụng các tính năng bảo mật sẵn có trong cơ sở dữ liệu (mã hóa, masking, kiểm soát truy cập) và bổ sung một lớp audit và access-control tập trung để giải quyết đúng điểm đau cốt lõi: hiện nay không ai biết ai đã đọc dữ liệu của khách nào, khi nào và vì sao.

Vấn đề cần giải quyết

Ba triệu chứng quan sát được trong hiện trạng đều quy về một gốc rễ chung:

  • Dữ liệu để trần và phân tán: PII (họ tên, số điện thoại, email, địa chỉ) được lưu plaintext, rải rác trên nhiều hệ thống — CRM, DB đơn hàng, log, file Excel xuất tay, backup, service đối tác.
  • Không có nhật ký truy cập: Khi xảy ra rò rỉ, không có bằng chứng để xác định nguồn. Mỗi lần điều tra là một lần “mò trong bóng tối”.
  • Không kiểm soát quyền theo mục đích: Quá nhiều người và dịch vụ đọc được gần như mọi thứ; không ghi nhận vì sao một bản ghi bị truy cập.

Hệ quả pháp lý: Nghị định 13/2023/NĐ-CP về bảo vệ dữ liệu cá nhân yêu cầu xử lý dữ liệu đúng mục đích, có kiểm soát và truy vết. Việc thiếu nhật ký và kiểm soát truy cập khiến doanh nghiệp khó chứng minh tuân thủ khi bị thanh tra.

Tổng quan kiến trúc hướng kết hợp

Giải pháp gồm hai trụ cột bổ sung cho nhau.

Trụ cột A — DB-native + Masking (lớp dữ liệu)

Tận dụng các tính năng bảo mật tích hợp sẵn trong cơ sở dữ liệu hiện đại:

  • TDE (Transparent Data Encryption): mã hóa toàn bộ dữ liệu khi lưu trên đĩa.
  • Column / Field-level Encryption: mã hóa riêng từng cột nhạy cảm với khóa quản lý tách biệt.
  • Dynamic Data Masking: che dữ liệu theo vai trò khi truy vấn.
  • Row-Level Security (RLS): giới hạn mỗi vai trò chỉ đọc được những dòng thuộc phạm vi của mình.

Trụ cột B — Lớp Audit & Access-Control tập trung

Đây là phần tạo khác biệt lớn nhất. Mọi truy vấn chạm vào PII đều được ghi nhận bởi một lớp tập trung, để lại dấu vết bất biến:

  • Cổng truy cập / Data Access Layer: ứng dụng đọc PII qua một service chung thay vì truy vấn trực tiếp bảng nhạy cảm.
  • Bắt buộc khai mục đích (purpose binding): mỗi yêu cầu đọc PII phải kèm lý do.
  • Audit log bất biến (append-only, hash-chained): mỗi truy cập ghi một dòng: ai · gì · khi nào · vì sao · kết quả.
  • RBAC + least-privilege, mặc định từ chối: thao tác nhạy cảm yêu cầu phê duyệt “bốn mắt”.
  • Phát hiện bất thường & cảnh báo realtime.

Vì sao chọn hướng kết hợp này

Tiêu chíTự xây VaultMua sản phẩmHướng kết hợp
Chi phí ban đầuCaoTrung bình–caoThấp
Thời gian triển khaiChậm (12+ tháng)Trung bìnhNhanh (theo quý)
Rủi ro lỗi mật mãCao (tự gánh)ThấpThấp
Chống rò rỉ & truy nguồnCó (trọng tâm)
Bảo vệ data in-useCó (nếu đúng)MạnhHạn chế
Phụ thuộc nhà cung cấpKhôngCaoThấp
Data residency (VN)Tự kiểm soátCần xác nhậnTự kiểm soát

Kết luận định vị: với mục tiêu số một là chống rò rỉ và truy nguồn, hướng kết hợp đạt được phần lớn giá trị với chi phí và rủi ro thấp nhất, đồng thời giữ toàn quyền kiểm soát dữ liệu trong nước.

Lộ trình tóm tắt theo giai đoạn

Giai đoạnTrọng tâmKết quả chính
GĐ 1Khảo sát & lập bản đồ dữ liệuBản đồ PII, ma trận phân loại
GĐ 2Lớp audit tập trung (ưu tiên cao nhất)Mọi truy cập PII để lại dấu vết bất biến
GĐ 3Mã hóa (TDE + cột) & maskingLộ DB/backup không còn lộ dữ liệu thật
GĐ 4Siết kiểm soát truy cậpQuyền tối thiểu, mặc định từ chối
GĐ 5Giám sát, phát hiện bất thườngPhát hiện sớm; điều tra còn vài phút
GĐ 6Tuân thủ, kiểm toán, vận hànhBằng chứng tuân thủ NĐ 13/2023