【自学AI】09 让 AI 记住你说过的话——多轮对话与会话管理实战

上一篇，我们完成了简历分析功能：用户上传简历，AI 返回一份结构化的分析报告。功能跑通了，感觉不错。
但有个问题，我当时没有提—— AI 其实什么都不记得。

开头：AI 的”失忆症”#

我们来还原一个真实的场景。

用户上传了简历，AI 分析完了，返回了报告。用户看了一眼，觉得有些地方不明白，于是继续问：

1
用户：你说的"改进空间"是什么意思？能详细说一下吗？
2

3
AI：抱歉，我没有看到之前的对话内容。
4
    请问您能把简历重新发一遍吗？

这就是没有对话历史的 AI。

它看到的只是”你说的改进空间是什么意思”这一句话。它不知道之前分析了什么，不知道”改进空间”指的是哪些内容，只能让用户重新发一遍。

这就像你和一个朋友聊了半小时，转头问他”你刚才说的那个问题怎么解决？” 他说：“不好意思，我们聊过吗？”
这样的体验，用一个词形容：割裂。

用户明明刚刚和 AI 聊过，转头就被当成陌生人。这在真实的面试系统里是不可接受的—— 用户需要和 AI 进行多轮对话，简历分析是第一步，后面还有追问、优化建议、模拟面试…… 每一步都需要 AI 记住之前说过什么。

这一篇，我们就来解决这个问题： 怎样管理对话历史，让 AI 记住之前的对话。

一、为什么需要对话历史？#

问题场景#

先把问题说清楚。假设用户和 AI 进行了这样的对话：

1
用户：请分析一下我的简历。
2
     我叫昇哥，工作 8 年，技术栈是 Vue全家桶熟练掌握、React全家桶熟悉 ... JS全栈开发
3

4
AI：根据你的简历，我发现了几个亮点：
5
    1. 工作年限符合要求
6
    2. 技术栈覆盖全面
7
    但也有一些改进空间：缺少大型项目经验，架构设计经历较少。
8

9
用户：你说的改进空间，能详细说一下吗？

现在，AI 要回答最后这个问题。

如果 AI 没有对话历史，它看到的只是：

1
用户：你说的改进空间，能详细说一下吗？

它不知道”改进空间”是什么，不知道之前分析了什么简历，只能回答”请问您指的是哪方面的改进空间？“——完全没有意义。

解决思路#

解决办法其实很简单：每次调用 AI 时，把之前的对话历史一起发过去。

1
第一次调用：
2
  AI 看到：[用户的简历分析请求]
3
  AI 返回：[分析报告]
4

5
第二次调用：
6
  AI 看到：[用户的简历分析请求] + [AI 的分析报告] + [用户的追问]
7
  AI 返回：[基于完整上下文的详细回答]

AI 之所以能理解”你说的改进空间”，是因为它看到了完整的对话过程。

问题的本质只有一句话： AI 没有天然的记忆，所谓”记住”，是我们帮它把历史背在身上，每次一起带过去。

核心思想只有一句话：保存对话历史，每次调用 AI 时一起发送。

二、消息的数据结构#

在动手写代码之前，先把数据结构搞清楚。

Message 接口#

在 LangChain 和大多数 AI 框架里，对话历史由一条一条的”消息”组成。每条消息有两个字段：谁说的，和说了什么。

1
interface Message {
2
  role: 'system' | 'user' | 'assistant';
3
  content: string;
4
}

role 有三个取值：

role	含义	例子
`system`	系统消息，给 AI 的角色定义	”你是一个资深的 Java 面试官，有 15 年经验”
`user`	用户说的话	”请分析一下我的简历”
`assistant`	AI 的回答	”根据你的简历，我发现了几个亮点…”

为什么恰好是这三个角色？因为一段对话里只有三种声音： 规则制定者（system）、提问者（user）、回答者（assistant）。三者缺一不可——没有 system，AI 不知道自己是谁；没有历史的 user/assistant，AI 不知道聊过什么。

对话历史是一个数组#

一次完整的对话，就是把所有消息按顺序放在数组里：

1
const conversationHistory: Message[] = [
2
  {
3
    role: 'system',
4
    content: '你是一个资深的简历分析官，有 15 年的经验...',
5
  },
6
  {
7
    role: 'user',
8
    content: '请分析一下我的简历。我叫昇哥，工作 8 年...',
9
  },
10
  {
11
    role: 'assistant',
12
    content: '根据你的简历，我发现了几个亮点：...',
13
  },
14
  {
15
    role: 'user',
16
    content: '你说的改进空间，能详细说一下吗？',
17
  },
18
  // 下一次调用 AI 时，把上面整个数组都发过去
19
];

⚠️ 关键点：不是只发最新的那条消息，而是整个数组都要发给 AI。用户的第二个问题只有一句话，但 AI 能理解它，是因为看到了前面所有的上下文。

三、代码实现#

明确了思路和数据结构，现在一步一步写代码。

Step 1：定义类型#

创建 src/ai/interfaces/message.interface.ts：

1
export interface Message {
2
  role: 'system' | 'user' | 'assistant';
3
  content: string;
4
}
5

6
export interface SessionData {
7
  sessionId: string;
8
  userId: string;
9
  position: string;
10
  messages: Message[];
11
  createdAt: Date;
12
  lastActivityAt: Date;
13
}

SessionData 是一个完整的会话对象，包含：

sessionId：会话唯一标识，用于区分不同用户的不同对话
messages：这次会话的所有消息历史
lastActivityAt：最后活跃时间，用于清理过期会话

Step 2：安装依赖#

我们需要 uuid 来生成唯一的会话 ID：

1
pnpm add uuid@13.0.0

Step 3：创建 SessionManager#

这是本篇最核心的服务。创建 src/ai/services/session.manager.ts：

1
import { Injectable, Logger } from '@nestjs/common';
2
import { v4 as uuidv4 } from 'uuid';
3
import { Message, SessionData } from '../interfaces/message.interface';
4

5
@Injectable()
6
export class SessionManager {
7
  private readonly logger = new Logger(SessionManager.name);
8

9
  // 用 Map 存储所有会话，key 是 sessionId
10
  // 注意：这是内存存储，服务器重启会丢失
11
  // 生产环境应该持久化到数据库（下一篇会讲）
12
  private sessions: Map<string, SessionData> = new Map();
13

14
  /**
15
   * 创建新会话
16
   *
17
   * @param userId 用户 ID
18
   * @param position 面试职位
19
   * @param systemMessage AI 的角色定义（System Message）
20
   * @returns 新会话的 sessionId
21
   */
22
  createSession(
23
    userId: string,
24
    position: string,
25
    systemMessage: string,
26
  ): string {
27
    const sessionId = uuidv4();
28

29
    const session: SessionData = {
30
      sessionId,
31
      userId,
32
      position,
33
      messages: [
34
        {
35
          role: 'system',
36
          content: systemMessage,
37
        },
38
      ],
39
      createdAt: new Date(),
40
      lastActivityAt: new Date(),
41
    };
42

43
    this.sessions.set(sessionId, session);
44
    this.logger.log(`创建会话: ${sessionId}，用户: ${userId}`);
45

46
    return sessionId;
47
  }
48

49
  /**
50
   * 向会话中添加一条消息
51
   *
52
   * @param sessionId 会话 ID
53
   * @param role 消息角色
54
   * @param content 消息内容
55
   */
56
  addMessage(
57
    sessionId: string,
58
    role: 'user' | 'assistant',
59
    content: string,
60
  ): void {
61
    const session = this.sessions.get(sessionId);
62

63
    if (!session) {
64
      throw new Error(`会话不存在: ${sessionId}`);
65
    }
66

67
    session.messages.push({ role, content });
68
    session.lastActivityAt = new Date(); // 更新最后活跃时间
69
  }
70

71
  /**
72
   * 获取会话的完整对话历史
73
   *
74
   * @param sessionId 会话 ID
75
   * @returns Message 数组
76
   */
77
  getHistory(sessionId: string): Message[] {
78
    const session = this.sessions.get(sessionId);
79
    return session?.messages || [];
80
  }
81

82
  /**
83
   * 获取最近的 N 条消息（用于控制 Token 消耗）
84
   *
85
   * 为什么需要这个方法？
86
   * 对话越长，每次发给 AI 的 token 就越多，成本越高。
87
   * 所以我们只保留最近的几条消息，旧的消息可以丢弃。
88
   *
89
   * 但有一个例外：System Message（第一条）必须始终保留。
90
   * 因为它定义了 AI 的角色，丢掉它 AI 就不知道自己是谁了。
91
   *
92
   * @param sessionId 会话 ID
93
   * @param count 保留最近几条消息（不含 System Message）
94
   */
95
  getRecentMessages(sessionId: string, count: number = 10): Message[] {
96
    const history = this.getHistory(sessionId);
97

98
    if (history.length === 0) {
99
      return [];
100
    }
101

102
    // System Message 是第一条，必须保留
103
    const systemMessage = history[0];
104

105
    // 取最近 count 条消息
106
    const recentMessages = history.slice(-count);
107

108
    // 如果最近的消息里已经包含了 System Message，直接返回
109
    if (recentMessages[0]?.role === 'system') {
110
      return recentMessages;
111
    }
112

113
    // 否则，在最前面加上 System Message
114
    return [systemMessage, ...recentMessages];
115
  }
116

117
  /**
118
   * 结束会话，从内存中删除
119
   *
120
   * @param sessionId 会话 ID
121
   */
122
  endSession(sessionId: string): void {
123
    if (this.sessions.has(sessionId)) {
124
      this.sessions.delete(sessionId);
125
      this.logger.log(`结束会话: ${sessionId}`);
126
    }
127
  }
128

129
  /**
130
   * 清理超过 1 小时未活动的过期会话
131
   *
132
   * 在生产环境中，应该用 @Cron 装饰器定期调用这个方法，
133
   * 防止内存无限增长。
134
   */
135
  cleanupExpiredSessions(): void {
136
    const now = new Date();
137
    const expirationTime = 60 * 60 * 1000; // 1 小时
138

139
    for (const [sessionId, session] of this.sessions.entries()) {
140
      if (now.getTime() - session.lastActivityAt.getTime() > expirationTime) {
141
        this.sessions.delete(sessionId);
142
        this.logger.warn(`清理过期会话: ${sessionId}`);
143
      }
144
    }
145
  }
146
}

这里有几个细节值得注意：

getRecentMessages 里为什么要特殊处理 System Message？

System Message 是 AI 的”人设”——“你是一个资深的 Java 面试官”。如果这条消息被截掉了，AI 就不知道自己的角色，回答会变得很奇怪。所以不管截取多少条历史消息，System Message 必须始终在第一位。

你可以把 System Message 理解成 AI 的”出厂设置”。历史消息可以截断，出厂设置不能丢。

为什么用 Map 而不是数组？

Map 的查找是 O(1)，用 sessionId 直接取到会话，不需要遍历。对话系统里每次收到消息都要查找会话，性能很重要。

Step 4：更新 AIModule#

把 SessionManager 加入 AI 模块，让其他模块可以注入它：

1
import { Module } from '@nestjs/common';
2
import { AIModelFactory } from './services/ai-model.factory';
3
import { SessionManager } from './services/session.manager';
4

5
@Module({
6
  providers: [AIModelFactory, SessionManager],
7
  exports: [AIModelFactory, SessionManager],  // 两个都导出
8
})
9
export class AIModule {}

Step 5：提取 Prompt 定义#

把所有 Prompt 集中到一个文件里管理。创建（或更新）src/interview/prompts/resume-analysis.prompts.ts：

1
/**
2
 * 简历分析的 System Message
3
 * 定义 AI 的角色，根据职位动态生成
4
 */
5
export const RESUME_ANALYSIS_SYSTEM_MESSAGE = (position: string): string => {
6
  return `你是一个资深的 ${position} 面试官，有 15 年的招聘经验。你能快速从简历中识别候选人的核心能力。`;
7
};
8

9
/**
10
 * 简历分析的主 Prompt
11
 * 用于第一次分析简历，返回结构化的 JSON 报告
12
 */
13
export const RESUME_ANALYSIS_PROMPT = `
14
你已经拥有以下信息，要求你进行分析：
15

16
## 简历内容
17

18
{resume_content}
19

20
## 岗位要求
21

22
{job_description}
23

24
## 分析要求
25

26
1. 提取候选人的：
27
   - 工作年限
28
   - 主要技能
29
   - 最近工作经历
30
   - 教育背景
31

32
2. 评估匹配度（0-100）
33

34
3. 识别优势和不足
35

36
## 输出格式（JSON）
37

38
{{
39
  "years_of_experience": 数字,
40
  "skills": ["技能1", "技能2"],
41
  "recent_position": "最近的职位",
42
  "education": "学历",
43
  "match_score": 数字（0-100）,
44
  "strengths": ["优势1", "优势2"],
45
  "gaps": ["缺陷1", "缺陷2"],
46
  "summary": "1-2 句总结"
47
}}
48
`;
49

50
/**
51
 * 多轮对话继续的 Prompt
52
 * 用于后续追问，基于已有的对话历史回答
53
 */
54
export const CONVERSATION_CONTINUATION_PROMPT = `基于以下对话历史，请回答最后一个问题。
55

56
对话历史：
57
{history}
58

59
请给出清晰、有逻辑的回答。`;

Step 6：创建 ResumeAnalysisService#

把简历分析的 Chain 逻辑单独提取成一个服务。创建 src/interview/services/resume-analysis.service.ts：

1
import { Injectable, Logger } from '@nestjs/common';
2
import { PromptTemplate } from '@langchain/core/prompts';
3
import { JsonOutputParser } from '@langchain/core/output_parsers';
4
import { AIModelFactory } from '../../ai/services/ai-model.factory';
5
import { RESUME_ANALYSIS_PROMPT } from '../prompts/resume-analysis.prompts';
6

7
@Injectable()
8
export class ResumeAnalysisService {
9
  private readonly logger = new Logger(ResumeAnalysisService.name);
10

11
  constructor(private aiModelFactory: AIModelFactory) {}
12

13
  async analyze(resumeContent: string, jobDescription: string): Promise<any> {
14
    const prompt = PromptTemplate.fromTemplate(RESUME_ANALYSIS_PROMPT);
15
    const model = this.aiModelFactory.createDefaultModel();
16
    const parser = new JsonOutputParser();
17

18
    const chain = prompt.pipe(model).pipe(parser);
19

20
    try {
21
      this.logger.log('开始分析简历...');
22

23
      const result = await chain.invoke({
24
        resume_content: resumeContent,
25
        job_description: jobDescription,
26
      });
27

28
      this.logger.log('简历分析完成');
29
      return result;
30
    } catch (error) {
31
      this.logger.error('简历分析失败:', error);
32
      throw error;
33
    }
34
  }
35
}

Step 7：创建 ConversationContinuationService#

为多轮对话创建专门的服务。创建 src/interview/services/conversation-continuation.service.ts：

1
import { Injectable, Logger } from '@nestjs/common';
2
import { PromptTemplate } from '@langchain/core/prompts';
3
import { AIModelFactory } from '../../ai/services/ai-model.factory';
4
import { Message } from '../../ai/interfaces/message.interface';
5
import { CONVERSATION_CONTINUATION_PROMPT } from '../prompts/resume-analysis.prompts';
6

7
@Injectable()
8
export class ConversationContinuationService {
9
  private readonly logger = new Logger(ConversationContinuationService.name);
10

11
  constructor(private aiModelFactory: AIModelFactory) {}
12

13
  /**
14
   * 基于对话历史继续对话
15
   *
16
   * @param history 当前会话的消息历史（Message 数组）
17
   * @returns AI 的回答文本
18
   */
19
  async continue(history: Message[]): Promise<string> {
20
    const prompt = PromptTemplate.fromTemplate(CONVERSATION_CONTINUATION_PROMPT);
21
    const model = this.aiModelFactory.createDefaultModel();
22

23
    // 注意：这里不需要 JsonOutputParser
24
    // 多轮对话的回答是自然语言，不是结构化 JSON
25
    const chain = prompt.pipe(model);
26

27
    try {
28
      this.logger.log(`继续对话，历史消息数: ${history.length}`);
29

30
      const response = await chain.invoke({
31
        // 把 Message 数组转成文本格式，发给 AI
32
        history: history.map((m) => `${m.role}: ${m.content}`).join('\n\n'),
33
      });
34

35
      const aiResponse = response.content as string;
36

37
      this.logger.log('对话继续完成');
38
      return aiResponse;
39
    } catch (error) {
40
      this.logger.error('继续对话失败:', error);
41
      throw error;
42
    }
43
  }
44
}

Step 8：更新 InterviewService#

现在 InterviewService 变得非常干净—— 它只负责会话管理和流程编排，不关心具体的 AI 调用细节：

1
import { Injectable, Logger } from '@nestjs/common';
2
import { SessionManager } from '../../ai/services/session.manager';
3
import { AIModelFactory } from '../../ai/services/ai-model.factory';
4
import { ResumeAnalysisService } from './resume-analysis.service';
5
import { ConversationContinuationService } from './conversation-continuation.service';
6
import { RESUME_ANALYSIS_SYSTEM_MESSAGE } from '../prompts/resume-analysis.prompts';
7

8
@Injectable()
9
export class InterviewService {
10
  private readonly logger = new Logger(InterviewService.name);
11

12
  constructor(
13
    private sessionManager: SessionManager,
14
    private aiModelFactory: AIModelFactory,
15
    private resumeAnalysisService: ResumeAnalysisService,
16
    private conversationContinuationService: ConversationContinuationService,
17
  ) {}
18

19
  /**
20
   * 分析简历（第一轮对话）
21
   * 创建新会话，调用 AI 分析，保存历史
22
   */
23
  async analyzeResume(
24
    userId: string,
25
    position: string,
26
    resumeContent: string,
27
    jobDescription: string,
28
  ) {
29
    try {
30
      // 第一步：创建新会话，写入 System Message
31
      const systemMessage = RESUME_ANALYSIS_SYSTEM_MESSAGE(position);
32
      const sessionId = this.sessionManager.createSession(
33
        userId,
34
        position,
35
        systemMessage,
36
      );
37

38
      this.logger.log(`创建会话: ${sessionId}`);
39

40
      // 第二步：调用简历分析服务
41
      const result = await this.resumeAnalysisService.analyze(
42
        resumeContent,
43
        jobDescription,
44
      );
45

46
      // 第三步：把这轮对话保存到会话历史
47
      this.sessionManager.addMessage(
48
        sessionId,
49
        'user',
50
        `简历内容：${resumeContent}`,
51
      );
52
      this.sessionManager.addMessage(
53
        sessionId,
54
        'assistant',
55
        JSON.stringify(result),
56
      );
57

58
      this.logger.log(`简历分析完成，sessionId: ${sessionId}`);
59

60
      return { sessionId, analysis: result };
61
    } catch (error) {
62
      this.logger.error(`分析简历失败: ${error}`);
63
      throw error;
64
    }
65
  }
66

67
  /**
68
   * 继续对话（多轮）
69
   * 基于已有会话，追加新消息，调用 AI 回答
70
   */
71
  async continueConversation(
72
    sessionId: string,
73
    userQuestion: string,
74
  ): Promise<string> {
75
    try {
76
      // 第一步：把用户的新问题加入历史
77
      this.sessionManager.addMessage(sessionId, 'user', userQuestion);
78

79
      // 第二步：取最近 10 条消息（含 System Message）
80
      const history = this.sessionManager.getRecentMessages(sessionId, 10);
81

82
      this.logger.log(
83
        `继续对话，sessionId: ${sessionId}，历史消息数: ${history.length}`,
84
      );
85

86
      // 第三步：调用对话继续服务
87
      const aiResponse =
88
        await this.conversationContinuationService.continue(history);
89

90
      // 第四步：把 AI 的回答也保存到历史
91
      this.sessionManager.addMessage(sessionId, 'assistant', aiResponse);
92

93
      this.logger.log(`对话继续完成，sessionId: ${sessionId}`);
94

95
      return aiResponse;
96
    } catch (error) {
97
      this.logger.error(`继续对话失败: ${error}`);
98
      throw error;
99
    }
100
  }
101
}

Step 9：更新 Module 和 Controller#

更新 interview.module.ts，注册新增的服务：

1
import { Module } from '@nestjs/common';
2
import { AIModule } from '../ai/ai.module';
3
import { InterviewController } from './interview.controller';
4
import { InterviewService } from './services/interview.service';
5
import { ResumeAnalysisService } from './services/resume-analysis.service';
6
import { ConversationContinuationService } from './services/conversation-continuation.service';
7

8
@Module({
9
  imports: [AIModule],
10
  providers: [
11
    InterviewService,
12
    ResumeAnalysisService,
13
    ConversationContinuationService,
14
  ],
15
  controllers: [InterviewController],
16
})
17
export class InterviewModule {}

更新 interview.controller.ts，添加两个接口：

1
// 接口 1：分析简历（需要登录）
2
@Post('/analyze-resume')
3
@UseGuards(JwtAuthGuard)
4
async analyzeResume(
5
  @Body() body: { position: string; resume: string; jobDescription: string },
6
  @Request() req: any,
7
) {
8
  const result = await this.interviewService.analyzeResume(
9
    req.user.userId,
10
    body.position,
11
    body.resume,
12
    body.jobDescription,
13
  );
14

15
  return { code: 200, data: result };
16
}
17

18
// 接口 2：继续对话（多轮）
19
@Post('/continue-conversation')
20
@UseGuards(JwtAuthGuard)
21
async continueConversation(
22
  @Body() body: { sessionId: string; question: string },
23
) {
24
  const result = await this.interviewService.continueConversation(
25
    body.sessionId,
26
    body.question,
27
  );
28

29
  return { code: 200, data: { response: result } };
30
}

四、测试接口#

代码写完了，来验证一下 AI 是否真的记住了上下文。

第一步：登录，获取 Token#

1
curl -X POST http://localhost:3000/user/login \
2
  -H "Content-Type: application/json" \
3
  -d '{
4
    "email": "test@example.com",
5
    "password": "123456"
6
  }'

从返回结果里取出 token 字段，后面要用。

第二步：分析简历，创建会话#

1
curl -X POST http://localhost:3000/interview/analyze-resume \
2
  -H "Content-Type: application/json" \
3
  -H "Authorization: Bearer 替换成你的token" \
4
  -d '{
5
    "position": "Java 后端开发工程师",
6
    "resume": "姓名：昇哥\n工作年限：8年\n技术栈：熟练掌握Vue全家桶，熟悉React全家桶，\n最近工作：高级前端开发\n主要项目：电商系统、报价系统\n教育背景：计算机本科，普通二本",
7
    "jobDescription": "职位：AI Agent开发\n工作年限：3-5年\n技能要求：TypeScript, React, Vue, MySQL, Redis\n岗位职责：设计高并发，高性能，交互流畅的系统 ..."
8
  }'

返回结果里有一个 sessionId，把它记下来，下一步要用：

1
{
2
  "code": 200,
3
  "data": {
4
    "sessionId": "3f4d27a6-c7eb-40c3-995f-220c2543fed1",
5
    "analysis": {
6
      "years_of_experience": 5,
7
      "skills": ["Java", "Spring Boot", "MySQL", "Redis"],
8
      "match_score": 85,
9
      "strengths": ["技术栈高度匹配", "有大型项目经验"],
10
      "gaps": ["缺少消息队列经验", "未提及架构设计经历"],
11
      "summary": "候选人技术栈与岗位匹配度高，建议进入技术面试。"
12
    }
13
  }
14
}

第三步：继续追问，验证 AI 的记忆#

1
curl -X POST http://localhost:3000/interview/continue-conversation \
2
  -H "Content-Type: application/json" \
3
  -H "Authorization: Bearer 替换成你的token" \
4
  -d '{
5
    "sessionId": "3f4d27a6-c7eb-40c3-995f-220c2543fed1",
6
    "question": "请问我的名字是什么？我有几年工作经验？"
7
  }'

如果一切正常，AI 会回答：

1
{
2
  "code": 200,
3
  "data": {
4
    "response": "根据您之前提供的简历，您的名字是昇哥，拥有 8 年的工作经验，主要技术栈包括 Vue全家桶，React全家桶 。。。 balabala 。"
5
  }
6
}

AI 记住了。你可以继续追问，它会一直记得这次会话里发生的所有对话。

五、架构优势（选读）#

你可能会问：为什么要拆成这么多层？直接在 InterviewService 里写 Prompt 和 Chain 不行吗？

可以，但会有问题。

代码能跑，不代表代码好。好的代码，是三个月后的你看到，不会骂自己的代码。

这里列出 5 个好处，你感受一下。

优势 1：关注点分离#

现在每一层只做一件事：

1
Prompt 定义（prompts/）
2
    ↓
3
AI 调用逻辑（ResumeAnalysisService / ConversationContinuationService）
4
    ↓
5
会话管理 + 流程编排（InterviewService）
6
    ↓
7
HTTP 接口（InterviewController）

改 Prompt 只动 prompts/ 文件，改 AI 调用逻辑只动对应的 Service，改接口只动 Controller。互不干扰。

优势 2：易于扩展#

将来要加新功能（比如编程题分析），只需要：

1
// 1. 新建 coding-question.prompts.ts
2
// 2. 新建 CodingQuestionService
3
// 3. 在 InterviewService 里调用它
4

5
async analyzeCodingQuestion(code: string, language: string) {
6
  const result = await this.codingQuestionService.analyze(code, language);
7
  // 保存到会话历史...
8
  return result;
9
}

现有的代码一行不用改。

优势 3：易于测试#

每一层都可以单独测试，用 mock 替换依赖：

1
// 测试 InterviewService 时，不需要真实调用 AI
2
jest.spyOn(resumeAnalysisService, 'analyze').mockResolvedValue({
3
  years_of_experience: 5,
4
  match_score: 85,
5
  // ...
6
});
7

8
const result = await interviewService.analyzeResume(...);
9
expect(result.sessionId).toBeDefined(); // 只测会话逻辑，不测 AI

优势 4：易于修改 Prompt#

想让 AI 多输出一个”缺少的技能”字段？只改 prompts 文件：

1
// 只改这一个文件，其他代码完全不动
2
export const RESUME_ANALYSIS_PROMPT = `
3
  ...
4
  ## 输出格式（JSON）
5
  {{
6
    ...
7
    "missing_skills": ["技能1", "技能2"],  // 新增这一行
8
    ...
9
  }}
10
`;

优势 5：易于切换模型#

从 DeepSeek 换成 OpenAI？只改 AIModelFactory 一个文件：

1
// 改这里，所有 Service 自动用上新模型
2
createDefaultModel(): ChatOpenAI {
3
  return new ChatOpenAI({
4
    apiKey: this.configService.get<string>('OPENAI_API_KEY'),
5
    model: 'gpt-4o',
6
  });
7
}

InterviewService、ResumeAnalysisService、ConversationContinuationService 的代码全部不用动。

这 5 个优势，说到底是同一件事： 改动不扩散。 改一个地方，只影响一个地方。这是好架构最朴素的标准。

六、常见问题#

Q1：什么时候应该结束会话？#

会话不主动结束，就是内存泄漏的开始。

会话应该在以下情况下结束：

用户主动点击”结束面试”
超过 1 小时未活动（cleanupExpiredSessions 自动处理）
服务器重启（内存清空）

1
// 主动结束
2
this.sessionManager.endSession(sessionId);
3

4
// 定期自动清理（配合 @Cron 装饰器使用）
5
@Cron('0 * * * *')  // 每小时执行一次
6
handleCleanup() {
7
  this.sessionManager.cleanupExpiredSessions();
8
}

Q2：一个用户可以同时有多个会话吗？#

可以。每个 sessionId 是独立的宇宙，互不干扰。

比如用户同时进行”简历分析”和”编程题”两个面试：

1
// 两个会话完全独立
2
const sessionId1 = sessionManager.createSession(userId, 'Java 开发', msg1);
3
const sessionId2 = sessionManager.createSession(userId, 'Python 开发', msg2);
4

5
sessionManager.addMessage(sessionId1, 'user', '...');  // 只影响会话 1
6
sessionManager.addMessage(sessionId2, 'user', '...');  // 只影响会话 2

Q3：对话历史应该保存多久？#

这是一个安全性和性能的权衡问题，没有标准答案，只有适合你场景的答案。

目前的实现是内存存储，服务器重启就会丢失。生产环境应该持久化到数据库。保存策略有三种：

策略	方式	优点	缺点
实时保存	每条消息立即写库	最安全，不丢数据	数据库写入频繁，性能差
定时保存	每 N 条消息写一次	折中方案	崩溃时可能丢失最近几条
批量保存	会话结束时统一写库	性能最好	崩溃时整个会话丢失

实际项目中，通常用定时保存——每 5-10 条消息写一次库，在安全性和性能之间取得平衡。

Q4：网络中断后如何恢复会话？#

用户不应该因为断网就丢失整个面试进度。

从数据库恢复到内存即可：

1
async reconnectSession(sessionId: string): Promise<SessionData> {
2
  // 先查内存
3
  let session = this.sessions.get(sessionId);
4

5
  if (!session) {
6
    // 内存没有，从数据库恢复
7
    session = await this.conversationRepository.findOne({ sessionId });
8

9
    if (!session) {
10
      throw new Error(`会话不存在: ${sessionId}`);
11
    }
12

13
    // 恢复到内存，后续操作走内存
14
    this.sessions.set(sessionId, session);
15
  }
16

17
  return session;
18
}

用户无论何时重连，都能接着之前的对话继续。

结尾#

这篇文章我们学了四件事：

✅ 为什么需要对话历史：AI 没有天然的记忆，需要我们把历史消息一起发给它
✅ 消息的数据结构：role + content，三种角色，整个数组都要发送
✅ SessionManager 的实现：创建会话、追加消息、获取历史、清理过期
✅ 分层架构的价值：每一层只做一件事，改 Prompt 不影响业务，换模型不影响接口

现在我们的系统可以进行真正的多轮对话了。

但细心的你可能已经发现了一个新问题：

对话越来越长，Token 消耗越来越多。

第 1 轮对话，发给 AI 的是 1 条消息。第 10 轮对话，发给 AI 的是 10 条消息。第 20 轮对话，发给 AI 的是 20 条消息。

每一轮的成本，都是前一轮的累加。一次完整的面试对话下来，Token 消耗可能是第 1 轮的 10-20 倍。

这不只是成本问题—— 每个模型都有 Token 上限，超过了直接报错。而且对话越长，AI 越容易”忘记”开头说的事—— 记得太多，反而记不住重要的。

下一篇，我们来解决这个问题： 如何在不丢失关键信息的前提下，控制对话历史的长度。

昇哥 · 2026年3月 全栈开发 × AI 学习途中，把踩过的坑写下来

音乐

音乐