Web3 数据隔离技术方案设计完全指南

数据隔离概述

什么是数据隔离？

数据隔离（Data Isolation）的核心定义：

┌─────────────────────────────────────────────────────┐
│                                                      │
│  确保不同用户/租户的数据：                          │
│                                                      │
│  ✅ 物理或逻辑上完全分离                            │
│  ✅ 互不可见、互不干扰                              │
│  ✅ 独立的安全边界                                  │
│  ✅ 满足合规要求                                    │
│                                                      │
└─────────────────────────────────────────────────────┘

形象比喻：
银行的保险柜（数据库）
├─ 每个客户有独立的格子（数据隔离）
├─ 只能用自己的钥匙打开（访问控制）
├─ 看不到其他人的财产（隐私保护）
└─ 银行记录所有访问（审计追踪）

数据隔离的三个维度

┌─────────────────────────────────────────────────────┐
│          数据隔离的三个关键维度                     │
├─────────────────────────────────────────────────────┤
│                                                      │
│  1. 用户维度（User Isolation）                      │
│     ├─ 个人用户数据隔离                            │
│     ├─ 用户 A 看不到用户 B 的数据                  │
│     └─ 示例：钱包余额、交易记录                    │
│                                                      │
│  2. 租户维度（Tenant Isolation）                    │
│     ├─ 企业/机构客户数据隔离                       │
│     ├─ 租户 1 完全独立于租户 2                     │
│     └─ 示例：SaaS 平台的不同企业客户               │
│                                                      │
│  3. 地域维度（Geographic Isolation）                │
│     ├─ 不同地区数据隔离                            │
│     ├─ 满足数据主权要求                            │
│     └─ 示例：欧盟 vs 美国数据                      │
│                                                      │
└─────────────────────────────────────────────────────┘

Web3 场景示例：

交易所平台：
├─ 用户隔离：Alice 的余额 vs Bob 的余额
├─ 租户隔离：机构 A 的托管资产 vs 机构 B 的托管资产
└─ 地域隔离：欧盟用户数据 vs 美国用户数据

钱包服务商：
├─ 用户隔离：用户私钥、交易历史
├─ 租户隔离：白标钱包 A vs 白标钱包 B
└─ 地域隔离：不同国家的 KYC 数据

为什么需要数据隔离

核心原因分析

┌─────────────────────────────────────────────────────────┐
│          数据隔离的 6 大核心驱动因素                    │
├─────────────────────────────────────────────────────────┤
│                                                          │
│  1. 安全性（Security）                      │
│     ┌──────────────────────────────────────┐          │
│     │  防止数据泄露和越权访问              │          │
│     │                                       │          │
│     │  风险场景：                           │          │
│     │  ├─ SQL 注入 → 查询到其他用户数据   │          │
│     │  ├─ 权限漏洞 → 访问未授权的资源     │          │
│     │  └─ 内部威胁 → 员工滥用权限         │          │
│     │                                       │          │
│     │  隔离后：                             │          │
│     │  ✅ 即使 SQL 注入也只能访问当前用户  │          │
│     │  ✅ 数据库层强制隔离                 │          │
│     │  ✅ 最小权限原则                     │          │
│     └──────────────────────────────────────┘          │
│                                                          │
│  2. 合规性（Compliance）                     │
│     ┌──────────────────────────────────────┐          │
│     │  满足法规和监管要求                  │          │
│     │                                       │          │
│     │  GDPR（欧盟）：                      │          │
│     │  ├─ 数据最小化原则                   │          │
│     │  ├─ 数据隔离和保护                   │          │
│     │  └─ 用户数据删除权                   │          │
│     │                                       │          │
│     │  SOX（美国）：                       │          │
│     │  ├─ 财务数据隔离                     │          │
│     │  └─ 访问控制审计                     │          │
│     │                                       │          │
│     │  PCI DSS：                           │          │
│     │  ├─ 持卡人数据隔离                   │          │
│     │  └─ 网络分段                         │          │
│     └──────────────────────────────────────┘          │
│                                                          │
│  3. 隐私保护（Privacy）                        │
│     ┌──────────────────────────────────────┐          │
│     │  保护用户隐私和敏感信息              │          │
│     │                                       │          │
│     │  敏感数据：                           │          │
│     │  ├─ 个人身份信息（PII）              │          │
│     │  ├─ KYC 文档                         │          │
│     │  ├─ 交易记录                         │          │
│     │  └─ 私钥和密码                       │          │
│     │                                       │          │
│     │  隔离措施：                           │          │
│     │  ✅ 字段级加密                       │          │
│     │  ✅ 访问日志记录                     │          │
│     │  ✅ 数据脱敏                         │          │
│     └──────────────────────────────────────┘          │
│                                                          │
│  4. 多租户架构（Multi-tenancy）                 │
│     ┌──────────────────────────────────────┐          │
│     │  SaaS 平台的核心需求                 │          │
│     │                                       │          │
│     │  场景：                               │          │
│     │  ├─ 白标钱包服务商                   │          │
│     │  ├─ 托管服务平台                     │          │
│     │  └─ DApp 基础设施提供商              │          │
│     │                                       │          │
│     │  要求：                               │          │
│     │  ✅ 每个租户数据完全隔离             │          │
│     │  ✅ 租户间性能不互相影响             │          │
│     │  ✅ 独立的配置和定制                 │          │
│     └──────────────────────────────────────┘          │
│                                                          │
│  5. 性能隔离（Performance Isolation）            │
│     ┌──────────────────────────────────────┐          │
│     │  防止"吵闹的邻居"问题                │          │
│     │                                       │          │
│     │  问题场景：                           │          │
│     │  租户 A 的大查询 → 影响租户 B 性能  │          │
│     │                                       │          │
│     │  解决方案：                           │          │
│     │  ├─ 资源配额限制                     │          │
│     │  ├─ 查询超时控制                     │          │
│     │  ├─ 连接池隔离                       │          │
│     │  └─ 读写分离                         │          │
│     └──────────────────────────────────────┘          │
│                                                          │
│  6. 故障隔离（Fault Isolation）                 │
│     ┌──────────────────────────────────────┐          │
│     │  限制故障影响范围                    │          │
│     │                                       │          │
│     │  隔离后：                             │          │
│     │  ├─ 租户 A 的数据损坏不影响租户 B   │          │
│     │  ├─ 单个数据库故障影响有限           │          │
│     │  └─ 便于故障恢复                     │          │
│     └──────────────────────────────────────┘          │
│                                                          │
└─────────────────────────────────────────────────────────┘

真实案例：不做数据隔离的后果

案例 1：SQL 注入导致大规模数据泄露
─────────────────────────────────────
场景：某交易所未做数据隔离
攻击：SQL 注入漏洞
结果：
├─ 攻击者获取所有用户的邮箱和余额
├─ 100 万用户数据泄露
├─ 监管罚款：$5M
└─ 品牌声誉受损

如果做了数据隔离：
✅ 即使 SQL 注入成功，也只能访问当前会话用户
✅ 影响范围：1 个用户 vs 100 万用户

案例 2：越权访问漏洞
─────────────────────────────────────
场景：某钱包服务商
漏洞：API 未验证租户身份
结果：
├─ 租户 A 可以查询租户 B 的用户数据
├─ 违反合同和 SLA
├─ 客户流失
└─ 法律诉讼

如果做了数据隔离：
✅ 数据库层强制租户隔离
✅ 即使应用层有漏洞，数据库也会拦截

案例 3：GDPR 罚款
─────────────────────────────────────
场景：某 DApp 平台
问题：未按地域隔离数据
结果：
├─ 欧盟用户数据存储在美国
├─ 违反 GDPR 数据主权要求
├─ 罚款：€20M 或年收入的 4%
└─ 业务暂停

如果做了地域隔离：
✅ 欧盟用户数据存储在欧盟
✅ 满足数据本地化要求
✅ 避免巨额罚款

数据隔离的层次与方案

隔离层次金字塔

┌─────────────────────────────────────────────────────────┐
│          数据隔离的 5 个层次（从上到下）                │
├─────────────────────────────────────────────────────────┤
│                                                          │
│  Level 1：应用层隔离（Application Level）               │
│  ┌────────────────────────────────────────────┐        │
│  │  应用代码中添加租户过滤                    │        │
│  │                                             │        │
│  │  示例：                                     │        │
│  │  SELECT * FROM users                        │        │
│  │  WHERE tenant_id = 'tenant-123'             │        │
│  │                                             │        │
│  │  优点：                                     │        │
│  │  ✅ 实现简单                                │        │
│  │  ✅ 灵活性高                                │        │
│  │                                             │        │
│  │  缺点：                                     │        │
│  │  ❌ 容易遗漏（开发人员忘记加过滤）         │        │
│  │  ❌ 安全性弱（应用层漏洞直接暴露）         │        │
│  │  ❌ 代码侵入性强                            │        │
│  └────────────────────────────────────────────┘        │
│                     ↓ 隔离强度增加                       │
│  Level 2：行级安全（Row Level Security）                │
│  ┌────────────────────────────────────────────┐        │
│  │  数据库层强制行级访问控制                  │        │
│  │                                             │        │
│  │  PostgreSQL RLS 策略：                     │        │
│  │  CREATE POLICY tenant_isolation             │        │
│  │  ON users FOR ALL                           │        │
│  │  USING (tenant_id = current_tenant());      │        │
│  │                                             │        │
│  │  优点：                                     │        │
│  │  ✅ 数据库层强制执行（不依赖应用）         │        │
│  │  ✅ 无法绕过                                │        │
│  │  ✅ 声明式配置                              │        │
│  │                                             │        │
│  │  缺点：                                     │        │
│  │  ❌ 性能开销（每次查询都检查）             │        │
│  │  ❌ 不是所有数据库都支持                   │        │
│  └────────────────────────────────────────────┘        │
│                     ↓                                    │
│  Level 3：表级隔离（Table Level）                       │
│  ┌────────────────────────────────────────────┐        │
│  │  每个租户有独立的表                        │        │
│  │                                             │        │
│  │  表命名：                                   │        │
│  │  ├─ users_tenant1                          │        │
│  │  ├─ users_tenant2                          │        │
│  │  └─ users_tenant3                          │        │
│  │                                             │        │
│  │  优点：                                     │        │
│  │  ✅ 物理隔离                                │        │
│  │  ✅ 性能独立                                │        │
│  │  ✅ 便于备份和恢复单个租户                 │        │
│  │                                             │        │
│  │  缺点：                                     │        │
│  │  ❌ 表数量爆炸（1000租户=1000表）          │        │
│  │  ❌ Schema 变更复杂                         │        │
│  │  ❌ 跨租户查询困难                          │        │
│  └────────────────────────────────────────────┘        │
│                     ↓                                    │
│  Level 4：Schema 级隔离（Schema Level）                 │
│  ┌────────────────────────────────────────────┐        │
│  │  每个租户独立的 Schema                     │        │
│  │                                             │        │
│  │  结构：                                     │        │
│  │  database                                   │        │
│  │  ├─ tenant1 (schema)                       │        │
│  │  │  ├─ users                               │        │
│  │  │  └─ orders                              │        │
│  │  ├─ tenant2 (schema)                       │        │
│  │  │  ├─ users                               │        │
│  │  │  └─ orders                              │        │
│  │                                             │        │
│  │  优点：                                     │        │
│  │  ✅ 良好的逻辑隔离                          │        │
│  │  ✅ 便于管理                                │        │
│  │  ✅ 支持租户级定制                          │        │
│  │                                             │        │
│  │  缺点：                                     │        │
│  │  ❌ 连接管理复杂                            │        │
│  │  ❌ Schema 数量有限制                       │        │
│  └────────────────────────────────────────────┘        │
│                     ↓                                    │
│  Level 5：数据库级隔离（Database Level）                │
│  ┌────────────────────────────────────────────┐        │
│  │  每个租户独立的数据库                      │        │
│  │                                             │        │
│  │  结构：                                     │        │
│  │  ├─ db_tenant1                             │        │
│  │  ├─ db_tenant2                             │        │
│  │  └─ db_tenant3                             │        │
│  │                                             │        │
│  │  优点：                                     │        │
│  │  ✅ 完全物理隔离                            │        │
│  │  ✅ 最高安全性                              │        │
│  │  ✅ 性能完全独立                            │        │
│  │  ✅ 易于迁移                                │        │
│  │                                             │        │
│  │  缺点：                                     │        │
│  │  ❌ 成本最高                                │        │
│  │  ❌ 运维复杂度高                            │        │
│  │  ❌ 资源利用率低                            │        │
│  └────────────────────────────────────────────┘        │
│                                                          │
└─────────────────────────────────────────────────────────┘

方案选择决策树

如何选择数据隔离方案？

┌─────────────────────────────────────┐
│  Q1: 租户数量？                     │
└──────────┬──────────────────────────┘
           │
    ┌──────┴──────┐
    │             │
  < 10        > 10
    │             │
    ▼             ▼
数据库级    ┌─────────────────────────┐
隔离        │  Q2: 安全要求？         │
(最安全)    └──────┬──────────────────┘
                   │
           ┌───────┴───────┐
           │               │
         极高            一般
           │               │
           ▼               ▼
       Schema级      ┌─────────────────┐
       隔离          │  Q3: 性能要求？ │
                     └──────┬──────────┘
                            │
                    ┌───────┴───────┐
                    │               │
                  很高            一般
                    │               │
                    ▼               ▼
                表级隔离        行级安全
                              (RLS)
                              (推荐)

企业级实践（推荐）：

中小规模（< 100 租户）：
├─ 核心方案：行级安全（RLS）
├─ 补充方案：表级隔离（敏感租户）
└─ 成本：低

大规模（> 1000 租户）：
├─ 核心方案：行级安全（RLS）
├─ 补充方案：数据分片（Sharding）
└─ 成本：中

超大规模（> 10000 租户）：
├─ 核心方案：混合方案
│  ├─ 大租户：独立数据库
│  └─ 小租户：RLS + 分片
└─ 成本：高但可控

企业级架构设计

完整架构概览

┌─────────────────────────────────────────────────────────────┐
│     Web3 企业级多租户数据隔离架构（完整方案）              │
├─────────────────────────────────────────────────────────────┤
│                                                              │
│  ┌────────────────────────────────────────────────────┐    │
│  │       应用层（Application Layer）                  │    │
│  │  ┌──────────┬──────────┬──────────┬──────────┐   │    │
│  │  │ Web API  │ Mobile   │ Admin    │ Partner  │   │    │
│  │  │          │ API      │ Portal   │ API      │   │    │
│  │  └────┬─────┴────┬─────┴────┬─────┴────┬─────┘   │    │
│  └───────┼──────────┼──────────┼──────────┼─────────┘    │
│          │          │          │          │               │
│          └──────────┴──────────┴──────────┘               │
│                      ▼                                     │
│  ┌────────────────────────────────────────────────────┐   │
│  │    租户识别层（Tenant Identification Layer）       │   │
│  │  ┌──────────────────────────────────────────────┐ │   │
│  │  │  租户识别中间件                              │ │   │
│  │  │  ├─ JWT Token 解析（tenant_id）             │ │   │
│  │  │  ├─ 子域名识别（tenant1.platform.com）      │ │   │
│  │  │  ├─ Header 识别（X-Tenant-ID）              │ │   │
│  │  │  └─ Context 注入（设置当前租户）            │ │   │
│  │  └──────────────┬────────────────────────────────┘ │   │
│  └─────────────────┼──────────────────────────────────┘   │
│                    ▼                                       │
│  ┌────────────────────────────────────────────────────┐   │
│  │    业务逻辑层（Business Logic Layer）             │   │
│  │  ┌──────────────────────────────────────────────┐ │   │
│  │  │  业务服务（自动注入租户过滤）                │ │   │
│  │  │  ├─ User Service                             │ │   │
│  │  │  ├─ Wallet Service                           │ │   │
│  │  │  ├─ Transaction Service                      │ │   │
│  │  │  └─ KYC Service                              │ │   │
│  │  └──────────────┬────────────────────────────────┘ │   │
│  └─────────────────┼──────────────────────────────────┘   │
│                    ▼                                       │
│  ┌────────────────────────────────────────────────────┐   │
│  │    数据访问层（Data Access Layer）                 │   │
│  │  ┌──────────────────────────────────────────────┐ │   │
│  │  │  ORM 层（带租户过滤）                        │ │   │
│  │  │  ├─ 自动添加 tenant_id 过滤                 │ │   │
│  │  │  ├─ 查询拦截器                              │ │   │
│  │  │  └─ 连接池管理（按租户隔离）                │ │   │
│  │  └──────────────┬────────────────────────────────┘ │   │
│  └─────────────────┼──────────────────────────────────┘   │
│                    ▼                                       │
│  ┌────────────────────────────────────────────────────┐   │
│  │    数据库层（Database Layer）                      │   │
│  │  ┌──────────────────────────────────────────────┐ │   │
│  │  │  PostgreSQL（行级安全 RLS）                 │ │   │
│  │  │                                              │ │   │
│  │  │  ┌─────────────────────────────────┐        │ │   │
│  │  │  │  主数据库（Primary）            │        │ │   │
│  │  │  │  ├─ RLS 策略强制执行            │        │ │   │
│  │  │  │  ├─ 租户数据物理共存            │        │ │   │
│  │  │  │  └─ 逻辑完全隔离                │        │ │   │
│  │  │  └─────────────┬──────────────────┘        │ │   │
│  │  │                ▼                            │ │   │
│  │  │  ┌─────────────────────────────────┐        │ │   │
│  │  │  │  从库（Replicas）               │        │ │   │
│  │  │  │  ├─ 读写分离                    │        │ │   │
│  │  │  │  └─ 负载均衡                    │        │ │   │
│  │  │  └─────────────────────────────────┘        │ │   │
│  │  │                                              │ │   │
│  │  │  大租户独立数据库（可选）：                 │ │   │
│  │  │  ┌─────────────────────────────────┐        │ │   │
│  │  │  │  db_enterprise_tenant_1          │        │ │   │
│  │  │  │  db_enterprise_tenant_2          │        │ │   │
│  │  │  └─────────────────────────────────┘        │ │   │
│  │  └──────────────────────────────────────────────┘ │   │
│  └────────────────────────────────────────────────────┘   │
│                                                            │
│  ┌────────────────────────────────────────────────────┐   │
│  │    加密层（Encryption Layer）                      │   │
│  │  ┌──────────────┬──────────────┬──────────────┐   │   │
│  │  │ 传输加密     │ 存储加密     │ 字段级加密   │   │   │
│  │  │ (TLS 1.3)    │ (AES-256)    │ (敏感字段)   │   │   │
│  │  └──────────────┴──────────────┴──────────────┘   │   │
│  └────────────────────────────────────────────────────┘   │
│                                                            │
│  ┌────────────────────────────────────────────────────┐   │
│  │    访问控制层（Access Control Layer）              │   │
│  │  ┌──────────────────────────────────────────────┐ │   │
│  │  │  RBAC + ABAC                                 │ │   │
│  │  │  ├─ 角色权限管理                            │ │   │
│  │  │  ├─ 属性基础访问控制                        │ │   │
│  │  │  └─ 审计日志                                │ │   │
│  │  └──────────────────────────────────────────────┘ │   │
│  └────────────────────────────────────────────────────┘   │
│                                                            │
└─────────────────────────────────────────────────────────────┘

为什么采用这样的架构？

架构设计原理与理由：

1. 多层防御（Defense in Depth）
   
   原因：
   ├─ 单一防护层可能被突破
   ├─ 多层防护提供纵深防御
   └─ 即使一层失效，其他层仍保护
   
   层次：
   ├─ 应用层：代码级过滤
   ├─ 中间件层：租户识别
   ├─ 数据访问层：ORM 拦截
   ├─ 数据库层：RLS 强制执行
   └─ 加密层：数据保护
   
   效果：
   攻击者需要突破 5 层防护才能成功

2. 行级安全（RLS）为核心
   
   为什么选择 RLS？
   ├─ 数据库层强制执行（最可靠）
   ├─ 对应用透明（代码侵入性小）
   ├─ 性能可接受（有索引优化）
   └─ PostgreSQL 原生支持
   
   vs 应用层过滤：
   应用层：开发人员可能忘记加过滤 ❌
   RLS：数据库强制执行，无法绕过 ✅
   
   vs 表级隔离：
   表级：1000 租户 = 1000 表（管理复杂）❌
   RLS：1000 租户共用一张表 ✅

3. 混合隔离策略
   
   为什么混合？
   ├─ 80% 小租户：RLS（成本低）
   ├─ 15% 中租户：RLS + 分片（平衡）
   └─ 5% 大租户：独立数据库（性能好）
   
   决策标准：
   ├─ 数据量 < 100GB → RLS
   ├─ 数据量 100GB-1TB → RLS + 分片
   └─ 数据量 > 1TB → 独立数据库
   
   效果：
   ├─ 成本优化（共享资源）
   ├─ 性能保障（大租户独立）
   └─ 运维可控（不会爆炸）

4. 租户上下文管理
   
   为什么需要？
   ├─ 每个请求需要知道当前租户
   ├─ 传递给所有层
   └─ 确保数据访问正确
   
   实现方式：
   ├─ JWT Token（包含 tenant_id）
   ├─ 线程本地存储（Thread Local）
   ├─ Context 对象（传递给各层）
   └─ 数据库 Session 变量
   
   示例流程：
   请求 → 解析 JWT → 提取 tenant_id →
   设置 Context → 数据库 SET tenant_id →
   RLS 自动过滤

5. 读写分离
   
   为什么需要？
   ├─ 读多写少（80/20 原则）
   ├─ 主库专注写入
   ├─ 从库承担读取
   └─ 提升整体性能
   
   租户隔离+读写分离：
   ├─ 主库：强制 RLS（写入）
   ├─ 从库：强制 RLS（读取）
   └─ 隔离策略在所有节点生效

数据库 Schema 设计

租户数据表设计示例：

核心原则：所有表都包含 tenant_id

-- 用户表
CREATE TABLE users (
  id UUID PRIMARY KEY DEFAULT gen_random_uuid(),
  tenant_id UUID NOT NULL,      -- 租户 ID（必须）
  email VARCHAR(255) NOT NULL,
  password_hash TEXT NOT NULL,
  created_at TIMESTAMPTZ DEFAULT NOW(),
  updated_at TIMESTAMPTZ DEFAULT NOW(),
  
  -- 唯一约束（租户内）
  CONSTRAINT uk_tenant_email UNIQUE (tenant_id, email)
);

-- 钱包表
CREATE TABLE wallets (
  id UUID PRIMARY KEY DEFAULT gen_random_uuid(),
  tenant_id UUID NOT NULL,      -- 租户 ID
  user_id UUID NOT NULL,
  currency VARCHAR(10) NOT NULL,
  balance DECIMAL(36, 18) NOT NULL DEFAULT 0,
  created_at TIMESTAMPTZ DEFAULT NOW(),
  
  FOREIGN KEY (tenant_id, user_id) 
    REFERENCES users(tenant_id, id),
  CONSTRAINT uk_tenant_user_currency 
    UNIQUE (tenant_id, user_id, currency)
);

-- 交易表
CREATE TABLE transactions (
  id UUID PRIMARY KEY DEFAULT gen_random_uuid(),
  tenant_id UUID NOT NULL,      -- 租户 ID
  user_id UUID NOT NULL,
  type VARCHAR(20) NOT NULL,     -- deposit/withdrawal
  amount DECIMAL(36, 18) NOT NULL,
  status VARCHAR(20) NOT NULL,
  created_at TIMESTAMPTZ DEFAULT NOW(),
  
  -- 按租户和时间分区（PostgreSQL 分区表）
  PARTITION BY RANGE (tenant_id, created_at)
);

索引策略（关键）：

-- 复合索引（tenant_id 在最前面）
CREATE INDEX idx_users_tenant_id 
  ON users(tenant_id, created_at DESC);

CREATE INDEX idx_wallets_tenant_user 
  ON wallets(tenant_id, user_id);

CREATE INDEX idx_transactions_tenant_time 
  ON transactions(tenant_id, created_at DESC);

为什么 tenant_id 在索引最前面？
✅ 查询总是带 tenant_id 过滤
✅ 利用索引前缀快速定位
✅ 避免全表扫描

外键约束注意事项：
所有外键都包含 tenant_id
确保不会跨租户引用
示例：
FOREIGN KEY (tenant_id, user_id) 
  REFERENCES users(tenant_id, id)
而不是：
FOREIGN KEY (user_id) REFERENCES users(id)

加密存储方案

多层加密架构

┌─────────────────────────────────────────────────────────┐
│          数据加密的三个层次                             │
├─────────────────────────────────────────────────────────┤
│                                                          │
│  Layer 1: 传输层加密（Encryption in Transit）          │
│  ┌────────────────────────────────────────────┐        │
│  │  所有网络传输加密                          │        │
│  │                                             │        │
│  │  协议：                                     │        │
│  │  ├─ TLS 1.3（HTTPS）                       │        │
│  │  ├─ 数据库连接（SSL/TLS）                  │        │
│  │  └─ 内部服务（mTLS）                       │        │
│  │                                             │        │
│  │  配置：                                     │        │
│  │  ├─ 强加密套件                             │        │
│  │  ├─ 前向保密（Forward Secrecy）            │        │
│  │  └─ HSTS（强制 HTTPS）                     │        │
│  └────────────────────────────────────────────┘        │
│                     ↓                                    │
│  Layer 2: 存储层加密（Encryption at Rest）             │
│  ┌────────────────────────────────────────────┐        │
│  │  整盘加密                                  │        │
│  │                                             │        │
│  │  方案：                                     │        │
│  │  ├─ 数据库文件加密（TDE）                  │        │
│  │  │  └─ PostgreSQL: pgcrypto                │        │
│  │  ├─ 磁盘加密（LUKS / dm-crypt）            │        │
│  │  └─ 云存储加密（AWS EBS / S3）             │        │
│  │                                             │        │
│  │  优点：                                     │        │
│  │  ✅ 防止物理盗窃                            │        │
│  │  ✅ 满足合规要求                            │        │
│  │  ✅ 对应用透明                              │        │
│  └────────────────────────────────────────────┘        │
│                     ↓                                    │
│  Layer 3: 字段级加密（Field Level Encryption）         │
│  ┌────────────────────────────────────────────┐        │
│  │  敏感字段单独加密                          │        │
│  │                                             │        │
│  │  需要加密的字段：                          │        │
│  │  ├─ 个人身份信息（PII）                    │        │
│  │  │  └─ 姓名、身份证号、护照号              │        │
│  │  ├─ 金融信息                               │        │
│  │  │  └─ 银行卡号、钱包地址                  │        │
│  │  ├─ KYC 文档                               │        │
│  │  └─ 私钥、密码（特殊处理）                 │        │
│  │                                             │        │
│  │  加密方案：                                 │        │
│  │  ┌──────────────────────────────┐          │        │
│  │  │  AES-256-GCM                 │          │        │
│  │  │  ├─ 对称加密（快速）         │          │        │
│  │  │  ├─ 认证加密（防篡改）       │          │        │
│  │  │  └─ 每个租户独立密钥         │          │        │
│  │  └──────────────────────────────┘          │        │
│  └────────────────────────────────────────────┘        │
│                                                          │
└─────────────────────────────────────────────────────────┘

密钥管理架构

┌─────────────────────────────────────────────────────────┐
│          密钥管理层次结构（Key Hierarchy）              │
├─────────────────────────────────────────────────────────┤
│                                                          │
│  Level 1: 主密钥（Master Key）                          │
│  ┌────────────────────────────────────────────┐        │
│  │  存储：HSM / AWS KMS / HashiCorp Vault     │        │
│  │  用途：加密租户密钥                        │        │
│  │  轮换：每年一次                            │        │
│  │  访问：严格控制，审计所有访问              │        │
│  └────────────┬───────────────────────────────┘        │
│               ▼ 派生                                     │
│  Level 2: 租户密钥（Tenant Key）                        │
│  ┌────────────────────────────────────────────┐        │
│  │  每个租户一个独立密钥                      │        │
│  │                                             │        │
│  │  生成：                                     │        │
│  │  tenant_key = KDF(master_key, tenant_id)   │        │
│  │                                             │        │
│  │  存储：加密后存储在数据库                  │        │
│  │  ├─ tenant_id: "tenant-123"                │        │
│  │  └─ encrypted_key: "..."                   │        │
│  │                                             │        │
│  │  使用：                                     │        │
│  │  ├─ 应用启动时解密                         │        │
│  │  ├─ 缓存在内存（Redis）                    │        │
│  │  └─ 定期刷新                               │        │
│  └────────────┬───────────────────────────────┘        │
│               ▼ 派生                                     │
│  Level 3: 数据加密密钥（DEK）                           │
│  ┌────────────────────────────────────────────┐        │
│  │  用于实际加密数据                          │        │
│  │                                             │        │
│  │  生成：                                     │        │
│  │  dek = KDF(tenant_key, purpose)            │        │
│  │                                             │        │
│  │  用途区分：                                 │        │
│  │  ├─ dek_pii: 加密 PII 数据                 │        │
│  │  ├─ dek_kyc: 加密 KYC 文档                 │        │
│  │  └─ dek_wallet: 加密钱包私钥               │        │
│  └────────────────────────────────────────────┘        │
│                                                          │
└─────────────────────────────────────────────────────────┘

优势：
✅ 租户密钥隔离（一个泄露不影响其他）
✅ 密钥轮换简单（只需重新加密租户密钥）
✅ 满足合规要求（密钥分层管理）
✅ 可以实现"删除即遗忘"（删除密钥=数据不可恢复）

密钥轮换策略：
定期轮换（推荐）：
├─ 主密钥：每年
├─ 租户密钥：每季度（可选）
└─ 数据加密密钥：每月（可选）

紧急轮换（安全事件）：
├─ 密钥泄露
├─ 员工离职
└─ 安全审计发现问题

GDPR "被遗忘权"实现：
删除用户数据：
├─ 方案 1：实际删除数据（慢）
└─ 方案 2：删除加密密钥（快）
   ✅ 数据物理存在但无法解密
   ✅ 满足 GDPR 要求
   ✅ 性能好

访问控制机制

RBAC + ABAC 混合模型

┌─────────────────────────────────────────────────────────┐
│          访问控制架构（RBAC + ABAC）                    │
├─────────────────────────────────────────────────────────┤
│                                                          │
│  RBAC（基于角色的访问控制）                             │
│  ┌────────────────────────────────────────────┐        │
│  │  角色定义：                                │        │
│  │                                             │        │
│  │  租户级角色：                              │        │
│  │  ├─ Tenant Admin（租户管理员）            │        │
│  │  │  ├─ 管理租户内所有用户                 │        │
│  │  │  ├─ 配置租户设置                       │        │
│  │  │  └─ 查看租户内所有数据                 │        │
│  │  │                                         │        │
│  │  ├─ User Manager（用户管理员）            │        │
│  │  │  ├─ 管理用户账号                       │        │
│  │  │  └─ 重置密码                           │        │
│  │  │                                         │        │
│  │  ├─ Finance Officer（财务人员）           │        │
│  │  │  ├─ 查看交易记录                       │        │
│  │  │  ├─ 审批提现                           │        │
│  │  │  └─ 生成财务报表                       │        │
│  │  │                                         │        │
│  │  ├─ Compliance Officer（合规人员）        │        │
│  │  │  ├─ 查看 KYC 数据                      │        │
│  │  │  ├─ 审批 KYC                           │        │
│  │  │  └─ 生成合规报告                       │        │
│  │  │                                         │        │
│  │  └─ Regular User（普通用户）              │        │
│  │     ├─ 查看自己的数据                     │        │
│  │     └─ 修改自己的设置                     │        │
│  │                                             │        │
│  │  平台级角色：                              │        │
│  │  ├─ Platform Admin（平台管理员）          │        │
│  │  │  ├─ 管理所有租户                       │        │
│  │  │  └─ 系统配置                           │        │
│  │  │                                         │        │
│  │  └─ Support Engineer（技术支持）          │        │
│  │     ├─ 只读访问                           │        │
│  │     └─ 需要审批后临时提权                 │        │
│  └────────────────────────────────────────────┘        │
│                                                          │
│  ABAC（基于属性的访问控制）                             │
│  ┌────────────────────────────────────────────┐        │
│  │  动态访问决策（考虑上下文）               │        │
│  │                                             │        │
│  │  属性维度：                                │        │
│  │  ├─ 用户属性                              │        │
│  │  │  ├─ 角色                               │        │
│  │  │  ├─ 部门                               │        │
│  │  │  └─ 认证级别                           │        │
│  │  │                                         │        │
│  │  ├─ 资源属性                              │        │
│  │  │  ├─ 数据分类（public/internal/secret） │        │
│  │  │  ├─ 所有者                             │        │
│  │  │  └─ 敏感级别                           │        │
│  │  │                                         │        │
│  │  ├─ 环境属性                              │        │
│  │  │  ├─ 时间（工作时间 vs 非工作时间）     │        │
│  │  │  ├─ 地点（办公室 vs 远程）             │        │
│  │  │  ├─ IP 地址                            │        │
│  │  │  └─ 设备类型                           │        │
│  │  │                                         │        │
│  │  └─ 动作属性                              │        │
│  │     ├─ 操作类型（read/write/delete）      │        │
│  │     └─ 数据量                             │        │
│  │                                             │        │
│  │  策略示例：                                │        │
│  │  IF role = "Support Engineer"             │        │
│  │  AND time BETWEEN 09:00 AND 18:00         │        │
│  │  AND location = "office"                   │        │
│  │  AND data_sensitivity <= "internal"        │        │
│  │  THEN allow(read)                          │        │
│  └────────────────────────────────────────────┘        │
│                                                          │
└─────────────────────────────────────────────────────────┘

实施方案：

权限检查流程：
1. 识别请求者（Authentication）
2. 提取用户角色和属性
3. 确定目标资源和敏感级别
4. 评估 RBAC 规则
5. 评估 ABAC 策略
6. 记录访问日志
7. 返回决策结果

技术实现：
├─ Casbin（开源策略引擎）
├─ OPA (Open Policy Agent)
└─ 自研策略引擎

最小权限原则

最小权限实践：

1. 默认拒绝（Default Deny）
   所有访问默认拒绝
   明确授权才允许

2. 权限范围最小化
   ❌ 错误：授予 "admin" 角色
   ✅ 正确：授予具体权限
      - user:read
      - user:write (specific fields)

3. 临时提权（Just-in-Time Access）
   场景：技术支持需要查看用户数据
   
   流程：
   1. 支持工程师申请临时权限
   2. 审批（自动或人工）
   3. 授予 1 小时权限
   4. 自动记录所有操作
   5. 1 小时后自动撤销
   6. 生成审计报告

4. 定期权限审查
   ├─ 每季度审查用户权限
   ├─ 删除不活跃用户
   ├─ 撤销过期权限
   └─ 审计日志分析

GDPR 对数据隔离的要求：

┌─────────────────────────────────────────────────────────┐
│          GDPR 7 大原则与技术实现                        │
├─────────────────────────────────────────────────────────┤
│                                                          │
│  1. 数据最小化（Data Minimization）                     │
│     ├─ 只收集必要的数据                                │
│     ├─ 不过度收集                                      │
│     └─ 定期清理不需要的数据                            │
│                                                          │
│     实现：                                              │
│     ✅ Schema 设计时考虑必要性                          │
│     ✅ 定期清理过期数据                                 │
│     ✅ 匿名化非必要字段                                 │
│                                                          │
│  2. 目的限制（Purpose Limitation）                      │
│     ├─ 数据只用于声明的目的                            │
│     ├─ 不用于其他目的                                  │
│     └─ 用途变更需重新授权                              │
│                                                          │
│     实现：                                              │
│     ✅ 数据标注用途标签                                 │
│     ✅ 访问控制基于用途                                 │
│     ✅ 审计日志记录用途                                 │
│                                                          │
│  3. 数据准确性（Accuracy）                              │
│     ├─ 数据必须准确和最新                              │
│     ├─ 错误数据及时更正                                │
│     └─ 用户可以请求更正                                │
│                                                          │
│  4. 存储限制（Storage Limitation）                      │
│     ├─ 不长期保存数据                                  │
│     ├─ 达到目的后删除                                  │
│     └─ 明确保留期限                                    │
│                                                          │
│     实现：                                              │
│     ✅ 数据保留策略                                     │
│     ✅ 自动删除过期数据                                 │
│     ✅ 合规保留期：KYC 数据 5-7 年                      │
│                                                          │
│  5. 完整性和保密性（Integrity & Confidentiality）       │
│     ├─ 数据加密                                        │
│     ├─ 访问控制                                        │
│     └─ 防止未授权访问                                  │
│                                                          │
│  6. 可问责性（Accountability）                          │
│     ├─ 证明合规性                                      │
│     ├─ 记录处理活动                                    │
│     └─ 定期审计                                        │
│                                                          │
│  7. 数据主体权利                                        │
│     ├─ 访问权：用户可以获取自己的数据                  │
│     ├─ 更正权：用户可以更正错误数据                    │
│     ├─ 删除权：用户可以请求删除数据                    │
│     ├─ 限制处理权：用户可以限制某些处理                │
│     ├─ 数据可携权：用户可以导出数据                    │
│     └─ 反对权：用户可以反对某些处理                    │
│                                                          │
└─────────────────────────────────────────────────────────┘

数据主体权利的技术实现：

1. 访问权（Right to Access）
   用户请求：我想看我的所有数据
   
   实现：
   GET /api/gdpr/data-export
   
   返回：JSON 格式的所有用户数据
   ├─ 个人信息
   ├─ 交易记录
   ├─ KYC 数据
   └─ 审计日志

2. 删除权（Right to Erasure / "被遗忘权"）
   用户请求：删除我的所有数据
   
   实现方案 A（物理删除）：
   DELETE FROM users WHERE id = 'user-123'
   DELETE FROM wallets WHERE user_id = 'user-123'
   DELETE FROM transactions WHERE user_id = 'user-123'
   ...
   
   问题：
   ├─ 性能差（级联删除）
   ├─ 可能违反审计要求
   └─ 不可逆
   
   实现方案 B（加密删除，推荐）：
   DELETE FROM encryption_keys 
   WHERE user_id = 'user-123'
   
   优点：
   ✅ 数据仍存在但无法解密
   ✅ 满足 GDPR "无法识别"要求
   ✅ 保留审计追踪（匿名化）
   ✅ 性能好

3. 数据可携权（Right to Data Portability）
   用户请求：我想将数据转移到其他平台
   
   实现：
   GET /api/gdpr/data-export?format=json
   
   返回：
   ├─ 结构化数据（JSON/CSV）
   ├─ 机器可读
   └─ 可以导入其他系统

4. 同意管理（Consent Management）
   记录用户同意的内容和时间
   
   consent_records 表：
   ├─ user_id
   ├─ purpose（marketing/analytics/etc）
   ├─ consented（true/false）
   ├─ consented_at
   └─ ip_address

5. 数据处理记录（Records of Processing Activities）
   记录谁在何时访问了什么数据
   
   access_logs 表：
   ├─ user_id（访问者）
   ├─ resource_id（被访问的资源）
   ├─ action（read/write/delete）
   ├─ timestamp
   ├─ ip_address
   └─ purpose（访问目的）

跨境数据传输

GDPR 跨境数据传输机制：

问题：
欧盟用户数据不能随意传输到欧盟外

解决方案：

方案 1：数据本地化（Data Localization）
┌────────────────────────────────────┐
│  欧盟用户数据存储在欧盟            │
│  ├─ 欧盟数据中心（Frankfurt）     │
│  ├─ 只在欧盟内处理                │
│  └─ 不传输到其他地区              │
│                                    │
│  实现：                            │
│  ├─ 地域标记：user.region = 'EU'  │
│  ├─ 路由：EU 用户 → EU 数据库     │
│  └─ 严格隔离                      │
└────────────────────────────────────┘

方案 2：标准合同条款（SCC）
┌────────────────────────────────────┐
│  使用欧盟委员会批准的标准合同      │
│  ├─ 数据导出方和导入方签署        │
│  ├─ 保证数据保护水平              │
│  └─ 定期审计                      │
└────────────────────────────────────┘

方案 3：绑定公司规则（BCR）
┌────────────────────────────────────┐
│  跨国公司内部数据传输              │
│  ├─ 集团内统一的数据保护政策      │
│  ├─ 需要监管机构批准              │
│  └─ 适合大型企业                  │
└────────────────────────────────────┘

推荐方案（Web3 企业）：
数据本地化 + 严格隔离
├─ 欧盟用户 → 欧盟数据库
├─ 美国用户 → 美国数据库
├─ 亚洲用户 → 亚洲数据库
└─ 绝不跨区域传输个人数据

技术选型与最佳实践

完整技术栈

┌─────────────────────────────────────────────────────────┐
│        数据隔离技术栈（企业级推荐）                     │
├─────────────────────────────────────────────────────────┤
│                                                          │
│  【数据库】                                             │
│  ├─ PostgreSQL 14+（首选）                              │
│  │  优势：                                              │
│  │  ✅ 原生 RLS 支持                                    │
│  │  ✅ 成熟稳定                                         │
│  │  ✅ 丰富的扩展（pgcrypto, pg_partman）              │
│  │  ✅ JSON 支持（JSONB）                               │
│  │                                                      │
│  │  关键特性：                                          │
│  │  ├─ Row Level Security (RLS)                        │
│  │  ├─ Schema 隔离                                     │
│  │  ├─ 分区表（Partitioning）                          │
│  │  └─ 连接池（PgBouncer）                             │
│  │                                                      │
│  └─ 备选：MySQL 8.0+                                    │
│     注意：RLS 支持较弱，需要应用层实现                  │
│                                                          │
│  【加密】                                               │
│  ├─ 密钥管理                                            │
│  │  ├─ AWS KMS（云端）                                 │
│  │  ├─ HashiCorp Vault（自托管）                       │
│  │  └─ HSM 设备（高安全）                              │
│  │                                                      │
│  ├─ 字段加密                                            │
│  │  ├─ AES-256-GCM                                     │
│  │  └─ 库：NaCl/libsodium                              │
│  │                                                      │
│  └─ 传输加密                                            │
│     └─ TLS 1.3                                          │
│                                                          │
│  【访问控制】                                           │
│  ├─ Casbin（策略引擎）                                  │
│  │  ✅ 支持 RBAC / ABAC                                 │
│  │  ✅ 多语言支持                                       │
│  │  ✅ 灵活的策略语言                                   │
│  │                                                      │
│  └─ OPA (Open Policy Agent)                             │
│     ✅ CNCF 项目                                        │
│     ✅ 云原生                                           │
│                                                          │
│  【审计】                                               │
│  ├─ TimescaleDB（审计日志）                             │
│  ├─ Elasticsearch（日志搜索）                           │
│  └─ 自研审计系统                                        │
│                                                          │
│  【监控】                                               │
│  ├─ Prometheus + Grafana                                │
│  ├─ Datadog / New Relic                                 │
│  └─ 自定义监控                                          │
│                                                          │
│  【编程语言/框架】                                      │
│  ├─ Golang                                              │
│  │  ├─ GORM（ORM）                                     │
│  │  └─ sqlx（SQL builder）                             │
│  │                                                      │
│  ├─ Node.js                                             │
│  │  └─ Prisma / TypeORM                                 │
│  │                                                      │
│  └─ Java                                                │
│     └─ Hibernate / MyBatis                              │
│                                                          │
└─────────────────────────────────────────────────────────┘

最佳实践清单

✅ 架构设计最佳实践：

1. 多层防御
   ├─ 应用层过滤
   ├─ ORM 拦截
   ├─ 数据库 RLS
   └─ 加密保护

2. 行级安全为核心
   ├─ 所有表启用 RLS
   ├─ 强制执行 tenant_id 过滤
   └─ 无法绕过

3. 混合隔离策略
   ├─ 小租户：RLS（成本低）
   └─ 大租户：独立数据库（性能好）

4. 租户上下文管理
   ├─ JWT 包含 tenant_id
   ├─ 中间件自动识别
   └─ 传递给所有层

5. 加密分层
   ├─ 传输加密（TLS）
   ├─ 存储加密（TDE）
   └─ 字段加密（敏感数据）

6. 密钥分层管理
   ├─ 主密钥（HSM/KMS）
   ├─ 租户密钥
   └─ 数据加密密钥

7. 最小权限
   ├─ 默认拒绝
   ├─ 明确授权
   └─ 定期审查

8. GDPR 合规
   ├─ 数据本地化
   ├─ 实现数据主体权利
   └─ 完整审计追踪

✅ 开发实践：

1. 代码审查
   ├─ 检查 tenant_id 过滤
   ├─ 检查权限验证
   └─ 检查敏感数据加密

2. 自动化测试
   ├─ 租户隔离测试
   ├─ 权限测试
   └─ 安全测试

3. SQL 审查
   ├─ 禁止 SELECT *
   ├─ 必须包含 tenant_id
   └─ 使用参数化查询

4. 审计日志
   ├─ 记录所有数据访问
   ├─ 记录权限变更
   └─ 不可篡改

✅ 运维实践：

1. 定期安全审计
   ├─ 渗透测试
   ├─ 代码审计
   └─ 配置审查

2. 监控告警
   ├─ 异常访问
   ├─ 权限变更
   └─ 数据导出

3. 备份恢复
   ├─ 按租户备份
   ├─ 加密备份
   └─ 定期恢复演练

4. 事件响应
   ├─ 数据泄露预案
   ├─ 72小时通知（GDPR）
   └─ 补救措施

5. 合规检查
   ├─ GDPR 合规审查
   ├─ SOC 2 审计
   └─ ISO 27001 认证

总结

核心要点

数据隔离成功的关键：

1. 分层防御
   ├─ 不依赖单一防护层
   ├─ 多层防护纵深防御
   └─ 数据库层强制执行

2. 技术选型
   ├─ PostgreSQL RLS（核心）
   ├─ 混合隔离策略（灵活）
   └─ 完善的加密方案（安全）

3. 租户管理
   ├─ 清晰的租户识别
   ├─ 上下文传递
   └─ 强制隔离

4. 访问控制
   ├─ RBAC + ABAC
   ├─ 最小权限
   └─ 完整审计

5. 合规保障
   ├─ GDPR 数据本地化
   ├─ 数据主体权利实现
   └─ 审计追踪

6. 持续改进
   ├─ 定期安全审计
   ├─ 渗透测试
   └─ 监控优化

相关系列文章：