【自学AI】12 幂等性：让你的接口不怕用户乱点

上一篇，我们搭好了 SSE 流式推送的框架——用户发起请求，后端实时推送进度，前端进度条跟着动。
但上线之前，有一个问题必须先解决：
如果用户不小心点了两次”生成”按钮，怎么办？

开头：一个真实的麻烦#

先说一个我自己遇到过的场景。

测试接口的时候，网络有点慢，等了三秒没反应，就又点了一次。结果两个请求都跑完了——AI 被调用了两次，数据库里存了两条记录，配额扣了两次。

这不是用户的错。用户不知道后台在处理，他只是不确定有没有成功，所以再点了一次。

这种情况在真实产品里，比你想象的更常见：

用户等得不耐烦，连续点了好几次”生成”按钮
网络不稳定，客户端自动重试了请求
鼠标左键有问题，单击变成了双击

如果傻傻地执行每一个请求，后果是：

❌ 浪费 AI 调用次数（每次都要扣费）
❌ 浪费用户配额
❌ 浪费服务器资源
❌ 用户体验很差（等了 10 秒生成完，结果又生成了一遍）

解决这个问题的技术，叫做幂等性检查。

这篇文章，就来搞清楚：幂等性是什么、为什么需要它、以及怎样在代码里实现它。

一、什么是幂等性？#

先从数学说起#

幂等性（Idempotency）这个词来自数学。定义是：

对于某个操作 $f$ ，如果满足 $f(f(x)) = f(x)$ ，就说这个操作是幂等的。

举几个例子：

操作	验证	是否幂等
绝对值	`abs(abs(-5)) = abs(5) = 5 = abs(-5)`	✅ 是
向下取整	`floor(floor(3.7)) = floor(3) = 3 = floor(3.7)`	✅ 是
平方根	`sqrt(sqrt(4)) = sqrt(2) ≠ sqrt(4)`	❌ 否

简单说：做一次和做多次，结果一样，就是幂等的。

Web 开发里的幂等性#

在 Web 开发里，幂等性的意思是：

无论你调用同一个操作多少次，对系统最终状态的影响，都和调用一次一样。

HTTP 方法里有明确的幂等性约定：

方法	是否幂等	原因
`GET`	✅	只读，不改变状态
`PUT`	✅	更新操作，多次更新同一个值，结果一样
`DELETE`	✅	删除一个已经不存在的东西，还是”不存在”
`POST`	❌	每次调用都可能创建新资源、产生新副作用

我们的简历押题接口是 POST，按规范来说是非幂等的。每次调用都会：

调用一次 AI（花钱）
生成一份新的结果
消耗用户的配额

我们的困境#

问题就在这里：

接口按规范设计是非幂等的，但现实场景要求它必须幂等。

用户的操作是不可预测的。你永远不知道他会做什么——网络慢多点了一次，鼠标坏了单击变双击，或者就是不小心。

这些情况没办法在前端完全拦截，所以必须在后端做保护。

解决方案是：给每个请求一个唯一的 ID（requestId），通过检查这个 ID，判断是不是重复请求。

如果是重复请求，直接返回之前的结果，不重新生成，不扣费。

二、幂等性检查的完整流程#

用一张流程图来看整个判断逻辑：

1
用户发送请求（携带 requestId）
2
         │
3
         ▼
4
  requestId 存在吗？
5
    │           │
6
   没有         有
7
    │           │
8
    ▼           ▼
9
 直接执行    查询数据库
10
             │
11
             ▼
12
    找到这个 requestId 的记录吗？
13
         │              │
14
        没有            有
15
         │              │
16
         ▼              ▼
17
      新请求         检查状态
18
      继续执行    ┌────┴────┬────────────┐
19
                 │         │            │
20
              SUCCESS   PENDING       FAILED
21
                 │         │            │
22
                 ▼         ▼            ▼
23
           ✅ 重复请求  ⏳ 处理中    允许重试
24
           直接返回    告诉用户      重新生成
25
           已有结果    稍后查询
26
           不扣费

四个关键设计原则：

用 requestId 作为请求的唯一标识，由前端生成 UUID，每次用户主动发起新请求时生成一个新的
只有 SUCCESS 状态才返回缓存结果——成功过的请求，重复来了直接返回，不扣费
PENDING 状态拒绝重复——同一个请求还在处理中，告诉用户稍等，不要再起一个新的
FAILED 状态允许重试——之前失败了，用户可以重新尝试（通常会用新的 requestId）

每种状态，都有它该走的路。不强求，不混淆，各归其位。

三、代码实现#

Step 1：在 DTO 里加入 requestId#

首先，在 ResumeQuizDto 里加一个可选的 requestId 字段：

1
export class ResumeQuizDto {
2
  @ApiProperty({ description: '公司名称', example: '字节跳动', required: false })
3
  @IsString()
4
  @IsOptional()
5
  company?: string;
6

7
  @ApiProperty({ description: '岗位名称', example: '前端开发工程师' })
8
  @IsString()
9
  @IsNotEmpty()
10
  positionName: string;
11

12
  // ... 其他字段
13

14
  @ApiProperty({
15
    description: '请求ID（用于幂等性检查）',
16
    example: 'f47ac10b-58cc-4372-a567-0e02b2c3d479',
17
    required: false,
18
  })
19
  @IsUUID('4')
20
  @IsOptional()
21
  requestId?: string; // ← 幂等性检查的唯一标识，由前端生成
22
}

几个细节值得注意：

@IsUUID('4')：限定必须是 UUID v4 格式，防止传入奇怪的字符串
@IsOptional()：不强制要求，没有 requestId 的请求也能正常处理
由前端生成：不是后端生成的——后端生成的话，每次请求都会是新 ID，幂等性就失去意义了

Step 2：消费记录里存 requestId#

为了支持幂等性检查，ConsumptionRecord 里需要把 requestId 存进去。放在 metadata 字段里：

1
// 消费记录的关键字段
2
{
3
  recordId: string;
4
  userId: string;
5
  type: ConsumptionType;
6
  status: ConsumptionStatus; // PENDING / SUCCESS / FAILED / REFUNDED
7

8
  metadata: {
9
    requestId: string;     // ⭐ 关键：用于幂等性检查
10
    promptVersion: string;
11
  };
12

13
  resultId: string;
14
  startedAt: Date;
15
  completedAt?: Date;
16
}

为什么放在 metadata 里而不是直接放顶层？

因为 requestId 是”请求元数据”，不是业务数据本身。放在 metadata 里，结构更清晰，也方便后续扩展（比如加上 clientIp、userAgent 等）。

Step 3：实现幂等性检查逻辑#

在 executeResumeQuiz 方法开始时，加入幂等性检查：

1
private async executeResumeQuiz(
2
  userId: string,
3
  dto: ResumeQuizDto,
4
  progressSubject: Subject<ProgressEvent>,
5
): Promise<void> {
6
  let consumptionRecord: ConsumptionRecord | null = null;
7
  const recordId = uuidv4();
8
  const resultId = uuidv4();
9

10
  try {
11
    // ========== 幂等性检查 ==========
12
    if (dto.requestId) {
13
      const existingRecord = await this.consumptionRecordModel.findOne({
14
        userId,
15
        'metadata.requestId': dto.requestId, // ← MongoDB 嵌套字段用点符号
16
        status: {
17
          $in: [ConsumptionStatus.SUCCESS, ConsumptionStatus.PENDING],
18
        },
19
      });
20

21
      if (existingRecord) {
22
        if (existingRecord.status === ConsumptionStatus.SUCCESS) {
23
          // ✅ 重复请求，且之前已经成功——直接返回缓存，不扣费
24
          const existingResult = await this.quizResultModel.findOne({
25
            resultId: existingRecord.resultId,
26
          });
27

28
          progressSubject.next({
29
            type: 'complete',
30
            progress: 100,
31
            label: 'AI 已完成问题生成',
32
            message: 'AI 已完成问题生成',
33
            stage: 'done',
34
            data: {
35
              questions: existingResult?.questions ?? [],
36
              summary: existingResult?.summary ?? '',
37
              remainingCount: await this.getRemainingCount(userId, 'resume'),
38
              isFromCache: true, // ⭐ 标记这是缓存结果
39
            },
40
          });
41
          progressSubject.complete();
42
          return;
43
        }
44

45
        if (existingRecord.status === ConsumptionStatus.PENDING) {
46
          // ⏳ 同一个请求还在处理中
47
          throw new BadRequestException('请求正在处理中，请稍后查询结果');
48
        }
49
      }
50
    }
51

52
    // ========== 正常生成流程 ==========
53
    this.logger.log(`✅ 用户扣费成功`);
54

55
    consumptionRecord = await this.consumptionRecordModel.create({
56
      recordId,
57
      user: new Types.ObjectId(userId),
58
      userId,
59
      type: ConsumptionType.RESUME_QUIZ,
60
      status: ConsumptionStatus.PENDING,
61
      consumedCount: 1,
62
      description: `简历押题 - ${dto?.company} ${dto.positionName}`,
63
      inputData: {
64
        company: dto?.company || '',
65
        positionName: dto.positionName,
66
        minSalary: dto.minSalary,
67
        maxSalary: dto.maxSalary,
68
        jd: dto.jd,
69
        resumeId: dto.resumeId,
70
      },
71
      resultId,
72
      metadata: {
73
        requestId: dto.requestId, // ← 存入 requestId，供下次幂等性检查使用
74
        promptVersion: dto.promptVersion,
75
      },
76
      startedAt: new Date(),
77
    });
78

79
    // 步骤 3：调用 AI 生成题目（TODO：后续实现）
80
    // ...
81

82
  } catch (error) {
83
    if (consumptionRecord) {
84
      await this.consumptionRecordModel.updateOne(
85
        { _id: consumptionRecord._id },
86
        { status: ConsumptionStatus.FAILED, error: error.message },
87
      );
88
      await this.quotaService.refund(userId, 1);
89
    }
90

91
    progressSubject.error(error);
92
  }
93
}

这里有一个 MongoDB 查询语法的细节，值得单独说一下：

1
// ❌ 错误写法——这样查不到嵌套字段
2
{ requestId: dto.requestId }
3

4
// ✅ 正确写法——嵌套字段用"点符号"（dot notation）
5
{ 'metadata.requestId': dto.requestId }

MongoDB 里查询嵌套对象的字段，必须用点符号。这是一个很容易踩的坑，记住就好。

Step 4：注入 Schema#

1
@Module({
2
  imports: [
3
    MongooseModule.forFeature([
4
      { name: ConsumptionRecord.name, schema: ConsumptionRecordSchema },
5
      { name: ResumeQuizResult.name, schema: ResumeQuizResultSchema },
6
      { name: User.name, schema: UserSchema },
7
    ]),
8
  ],
9
})
10
export class InterviewModule {}

四、测试：验证幂等性是否生效#

第一步：登录，获取 Token#

1
curl -X POST http://localhost:3000/user/login \
2
  -H "Content-Type: application/json" \
3
  -d '{
4
    "email": "test@example.com",
5
    "password": "123456"
6
  }'

第二步：发送押题请求#

关键：两次请求使用相同的 requestId。

1
curl -X POST http://localhost:3000/interview/resume/quiz/stream \
2
  -H "Content-Type: application/json" \
3
  -H "Authorization: Bearer 替换成你的token" \
4
  -d '{
5
    "requestId": "c39f5c2e-8611-4f06-a87c-14ffcb7149ec",
6
    "company": "阿里巴巴",
7
    "positionName": "前端开发工程师",
8
    "minSalary": 25,
9
    "maxSalary": 35,
10
    "jd": "熟练掌握Vue.js框架及生态...",
11
    "resumeContent": "我叫张三，10年前端开发经验..."
12
  }'

第三步：验证幂等性#

同时打开两个终端，执行同一条命令（requestId 完全相同）：

预期结果：

第一个请求：正常走生成流程，最后 isFromCache: false
第二个请求：如果第一个还在处理中（PENDING），收到报错 "请求正在处理中"；如果第一个已经完成（SUCCESS），直接收到缓存结果，isFromCache: true

五、顺便说说上一篇遗留的坑#

上一篇跑通了 SSE 流式推送，但有一个现象让我困惑了一会儿：

重启服务后，第一条进度消息明明是 progress: 5，但前端收到的第一条却是 progress: 10。

反复重启了好几次，结果都一样。

最后定位到原因，是一个很典型的 RxJS 热流（Hot Observable）时序问题。

问题复现#

generateResumeQuizWithProgress 方法的原始写法：

1
generateResumeQuizWithProgress(userId, dto) {
2
  const subject = new Subject<ProgressEvent>()
3

4
  // ⚠️ 问题在这里：立刻执行，不等订阅建立
5
  void this.executeResumeQuiz(userId, dto, subject)
6

7
  return subject
8
}

执行顺序是这样的：

1
1. 进入 generateResumeQuizWithProgress()
2
2. 创建 subject
3
3. 立刻执行 executeResumeQuiz()
4
4. 第一轮循环：subject.next(5%)  ← 5% 在这里发出去了
5
5. generateResumeQuizWithProgress() 才 return subject
6
6. Controller 拿到 subject，才开始 .subscribe(...)  ← 订阅在这里才建立

问题就在第 4 步和第 6 步之间：

Subject 是”热的”（Hot Observable）——它不会帮你缓存历史消息。谁订阅得晚，谁就错过了之前的事件。

所以第一条 5% 在订阅建立之前就已经发出去了，客户端自然从第二条 10% 开始收到。

修复方式#

用 queueMicrotask 把”开始执行推送”推迟到当前调用栈结束之后：

1
generateResumeQuizWithProgress(userId, dto) {
2
  const subject = new Subject<ProgressEvent>()
3

4
  // ✅ 修复：等当前同步调用栈走完，让订阅先建立，再开始推送
5
  queueMicrotask(() => {
6
    void this.executeResumeQuiz(userId, dto, subject)
7
  })
8

9
  return subject
10
}

执行顺序变成了：

1
1. 进入 generateResumeQuizWithProgress()
2
2. 创建 subject
3
3. 把 executeResumeQuiz 注册到 microtask 队列（还没执行）
4
4. return subject
5
5. Controller 建立 .subscribe(...)  ← 订阅先建立
6
6. 当前调用栈结束
7
7. microtask 执行：executeResumeQuiz 开始运行
8
8. subject.next(5%)  ← 这时候订阅已经建立了，5% 能被收到

修复之后，前端收到的第一条就是 progress: 5 了。

这里学到的两个点#

第一：Subject 是热流，不缓存历史消息。

如果你需要”晚订阅的人也能收到之前的消息”，可以用 ReplaySubject(n)，它会缓存最近 n 条消息。但这个场景不需要，用 queueMicrotask 保证时序就够了。

第二：void someAsyncFn() 是”故意忽略 Promise 返回值”的写法。

如果直接写：

1
this.executeResumeQuiz(userId, dto, subject)

编辑器会提示：这个 Promise 没有被 await，也没有 .catch()，是一个”floating promise”，可能会漏掉错误。

加上 void 的意思是：

“我知道它返回 Promise，但这里就是要 fire-and-forget，请不要再提示我漏处理返回值。”

注意：void 只是告诉编辑器”我故意不接这个 Promise”，它本身不处理错误。 真正的错误处理在 executeResumeQuiz 内部的 try/catch 里，出错后通过 progressSubject.error(...) 传给 Controller。

六、缓存结果 vs 原始结果#

幂等性检查通过后，从缓存返回的结果和原始生成的结果内容一样，但有一个关键区别：

1
// 原始生成的结果
2
{
3
  resultId: "...",
4
  questions: [...],
5
  summary: "...",
6
  remainingCount: 9,    // 扣了一次配额
7
  isFromCache: false,
8
}
9

10
// 从缓存返回的结果
11
{
12
  resultId: "...",
13
  questions: [...],
14
  summary: "...",
15
  remainingCount: 10,   // 配额没有变化
16
  isFromCache: true,
17
}

isFromCache: true 意味着：这次请求没有扣费。

前端可以利用这个字段做 UI 处理，比如不显示”已消耗 1 次配额”的提示。

七、四个真实场景#

把上面的逻辑用具体场景串一遍，更容易记住：

场景 1：用户第一次请求（正常流程）

1
前端生成 requestId = "uuid-A"
2
发送请求
3
↓
4
后端查询：没找到 requestId = "uuid-A" 的记录
5
↓
6
执行完整生成流程，扣 1 次配额
7
↓
8
创建消费记录，status = SUCCESS，metadata.requestId = "uuid-A"
9
↓
10
返回结果，isFromCache: false

场景 2：用户重复请求（幂等性保护）

1
前端再次发送 requestId = "uuid-A"（与第一次相同）
2
↓
3
后端查询：找到 requestId = "uuid-A"，status = SUCCESS
4
↓
5
直接返回之前的结果，不扣费，不调用 AI
6
↓
7
返回结果，isFromCache: true

场景 3：请求还在处理中

1
用户发送 requestId = "uuid-A"
2
↓
3
后端正在生成（需要 10 秒），status = PENDING
4
↓
5
用户不耐烦，再发一次（仍然是 requestId = "uuid-A"）
6
↓
7
后端查询：找到记录，status = PENDING
8
↓
9
拒绝请求，返回错误："请求正在处理中，请稍后查询结果"

场景 4：用户主动重新生成

1
第一次：requestId = "uuid-A" → 成功
2
↓
3
用户点"重新生成"按钮
4
↓
5
前端生成新的 requestId = "uuid-B"
6
↓
7
后端查询：没找到 requestId = "uuid-B" 的记录
8
↓
9
执行完整生成流程，扣 1 次配额

关键在于：用户主动重新生成时，前端要生成一个新的 requestId。这样后端就知道这是一个新请求，而不是重复请求。

八、常见问题#

Q1：为什么查询时用 `$in: [SUCCESS, PENDING]`，不查 `FAILED`？#

SUCCESS：之前成功过，现在是重复请求，直接返回缓存
PENDING：同一个请求还在处理中，不应该再起一个新的
FAILED：之前失败了，用户可能想重试，应该允许重新生成
REFUNDED：已退款的历史记录，不影响新请求

所以只查 SUCCESS 和 PENDING，FAILED 和 REFUNDED 的记录不拦截。

Q2：幂等性检查要不要设置过期时间？#

可以加，也可以不加，取决于业务需求。

如果加了 24 小时过期：

1
const existingRecord = await this.consumptionRecordModel.findOne({
2
  userId,
3
  'metadata.requestId': dto.requestId,
4
  status: { $in: [ConsumptionStatus.SUCCESS, ConsumptionStatus.PENDING] },
5
  createdAt: {
6
    $gte: new Date(Date.now() - 24 * 60 * 60 * 1000),
7
  },
8
});

对于简历押题这个场景，我倾向于不加过期时间——用户想重新生成，就应该明确点”重新生成”按钮，前端生成新的 requestId。

边界清晰，意图明确，不靠时间来模糊处理。

Q3：前端怎样生成 `requestId`？#

1
import { v4 as uuidv4 } from 'uuid';
2

3
// 用户点击"生成题目"按钮时
4
const handleGenerate = async () => {
5
  const requestId = uuidv4(); // 每次点击都生成一个新的 UUID
6

7
  const response = await fetch('/interview/resume/quiz/stream', {
8
    method: 'POST',
9
    headers: {
10
      'Content-Type': 'application/json',
11
      'Authorization': `Bearer ${token}`,
12
    },
13
    body: JSON.stringify({
14
      positionName: '前端开发工程师',
15
      jd: '...',
16
      resumeContent: '...',
17
      requestId,
18
    }),
19
  });
20
};
21

22
// 用户点击"重新生成"按钮时
23
const handleRegenerate = async () => {
24
  const requestId = uuidv4(); // 重新生成一个新的 UUID，触发新的生成流程
25
  // ...
26
};

关键原则：每次用户主动发起新请求，就生成一个新的 requestId；重试同一个请求，就用同一个 requestId。

总结#

这篇文章，我们做了一件事：让接口不怕用户乱点。

回顾一下学到的东西：

✅ 幂等性是什么：同一个操作执行多次，结果和执行一次一样
✅ 为什么需要它：防止重复生成，节省成本，保护用户配额
✅ 怎样实现：用 requestId 作为唯一标识，查数据库判断是否重复
✅ 状态机设计：PENDING 拒绝重复，SUCCESS 返回缓存，FAILED 允许重试
✅ MongoDB 嵌套查询：用点符号 'metadata.requestId' 查嵌套字段
✅ 顺带搞清楚了两个坑：Subject 热流的时序问题，以及 void 的真实含义

幂等性检查是生产级系统的标配。它不只是省钱，更是让系统在面对不可预测的用户行为时，依然能稳定运转。

每个请求都有自己的 ID，每个 ID 都有自己的状态。该处理的处理，该拒绝的拒绝，该返回缓存的返回缓存。

各归其位，系统才稳。

这其实和做任何事情的道理一样—— 不是靠强力控制每一个变量，而是把边界划清楚，让每个部分按自己的轨道走。

下一篇，我们把”真实 AI 内容生成”接进来——从”假进度 + 空结果”升级成”真实调用 DeepSeek 生成题目 + 返回完整结果”。

Prompt 怎么设计、怎样解析 AI 输出、怎样保证输出格式稳定……这些都在下一篇。

昇哥 · 2026年3月 90后 JS 全栈 × AI 学习途中，把踩过的坑写下来 专注羽毛球，爱音乐，正在研究易经 🎵🏸

音乐

音乐

开头：一个真实的麻烦#

一、什么是幂等性？#

先从数学说起#

Web 开发里的幂等性#

我们的困境#

二、幂等性检查的完整流程#

三、代码实现#

Step 1：在 DTO 里加入 requestId#

Step 2：消费记录里存 requestId#

Step 3：实现幂等性检查逻辑#

Step 4：注入 Schema#

四、测试：验证幂等性是否生效#

第一步：登录，获取 Token#

第二步：发送押题请求#

第三步：验证幂等性#

五、顺便说说上一篇遗留的坑#

问题复现#

修复方式#

这里学到的两个点#

六、缓存结果 vs 原始结果#

七、四个真实场景#

八、常见问题#

Q1：为什么查询时用 `$in: [SUCCESS, PENDING]`，不查 `FAILED`？#

Q2：幂等性检查要不要设置过期时间？#

Q3：前端怎样生成 `requestId`？#

总结#

支持与分享

评论区

文章目录

音乐

音乐

【自学AI】12 幂等性：让你的接口不怕用户乱点

开头：一个真实的麻烦#

一、什么是幂等性？#

先从数学说起#

Web 开发里的幂等性#

我们的困境#

二、幂等性检查的完整流程#

三、代码实现#

Step 1：在 DTO 里加入 requestId#

Step 2：消费记录里存 requestId#

Step 3：实现幂等性检查逻辑#

Step 4：注入 Schema#

四、测试：验证幂等性是否生效#

第一步：登录，获取 Token#

第二步：发送押题请求#

第三步：验证幂等性#

五、顺便说说上一篇遗留的坑#

问题复现#

修复方式#

这里学到的两个点#

六、缓存结果 vs 原始结果#

七、四个真实场景#

八、常见问题#

Q1：为什么查询时用 $in: [SUCCESS, PENDING]，不查 FAILED？#

Q2：幂等性检查要不要设置过期时间？#

Q3：前端怎样生成 requestId？#

总结#

支持与分享

评论区

文章目录

Q1：为什么查询时用 `$in: [SUCCESS, PENDING]`，不查 `FAILED`？#

Q3：前端怎样生成 `requestId`？#