跳到主要内容

AI 智能总结

AI 智能总结是在 AI 智能流式语音识别功能基础上增加的智能总结功能。该功能能够自动分析通话内容,生成通话摘要、章节摘要、待办事项、话题提取等多种形式的总结内容,帮助用户快速回顾通话要点。

全场景适用

  • 音视频通话:自动生成通话纪要,记录通话要点、决策事项和待办任务,提升通话效率。
  • 在线培训:生成培训内容摘要和知识点总结,帮助学员快速回顾重点内容。
  • 客户沟通:记录客户需求、沟通要点和后续跟进事项,确保信息不遗漏。

前置条件

AI 智能总结是融云 RTC SDK 的高级功能。使用前需要满足以下条件:

服务开通

提交工单开通。

功能依赖

注意

AI 智能总结是基于 AI 智能流式语音识别开发的功能。使用该功能需要:

  1. 先集成 AI 智能流式语音识别 功能
  2. 在初始化 CallLib 时开启语音识别功能(具体配置方法请参考 AI 智能流式语音识别 文档)

注册智能总结代理

为了接收智能总结相关通知,您需要实现并注册相应的代理。通过代理,您可以接收智能总结任务的状态通知。

在发起通话或接听通话前,您需要通过 RCCallClientsetASRDelegate 方法设置智能总结代理。设置后,您将通过 RCCallASRDelegatedidReceiveStartSummarizationdidReceiveStopSummarization 方法获得智能总结任务状态通知。

接口原型

Objective C
- (void)setASRDelegate:(id<RCCallASRDelegate>)delegate;

回调方法说明

方法说明
didReceiveStartSummarization智能总结任务开始回调
didReceiveStopSummarization智能总结任务停止回调

didReceiveStartSummarization 参数说明

参数类型说明
taskIdNSString智能总结任务 ID,用于后续生成智能总结

didReceiveStopSummarization 参数说明

参数类型说明
taskIdNSString智能总结任务 ID

示例代码

实现 RCCallASRDelegate 中智能总结相关代理:

Objective C
@interface ASRDelegate () <RCCallASRDelegate>
// 智能总结任务开始回调
- (void)didReceiveStartSummarization:(NSString *)taskId;
// 智能总结任务停止回调
- (void)didReceiveStopSummarization:(NSString *)taskId;
@end

@implementation ASRDelegate
- (void)didReceiveStartASR {
// 语音识别开启回调
}

- (void)didReceiveStopASR {
// 语音识别停止回调
}

- (void)didReceiveStartSummarization:(NSString *)taskId {
// 处理智能总结任务开始通知
NSLog(@"智能总结任务开始,任务 ID:%@", taskId);
// 保存 taskId,用于后续生成智能总结
self.summarizationTaskId = taskId;
}

- (void)didReceiveStopSummarization:(NSString *)taskId {
// 处理智能总结任务停止通知
NSLog(@"智能总结任务停止,任务 ID:%@", taskId);
}
@end

注册智能总结代理:

Objective C
ASRDelegate *asrDelegate = [[ASRDelegate alloc] init];
self.asrDelegate = asrDelegate;
[[RCCallClient sharedRCCallClient] setASRDelegate:self.asrDelegate];

开启智能总结

在开启语音识别成功后,您需要调用 RCCallClientstartSummarization 方法开启智能总结服务。

开启成功后,其他客户端会通过 RCCallASRDelegatedidReceiveStartSummarization 方法收到通知。

注意

智能总结依赖语音识别服务,需要在收到 RCCallASRDelegatedidReceiveStartASR 回调后,调用开启智能总结;智能总结为通话级别功能,通话内任意用户开启后,所有用户都会收到开始通知。

接口原型

Objective C
- (void)startSummarization:(nullable void(^)(BOOL isSuccess, RCRTCCode code, NSString *taskId))completion;

参数说明

参数类型说明
completionBlock开启智能总结的回调,taskId 为智能总结任务 ID

示例代码

Objective C
[[RCCallClient sharedRCCallClient] startASR:^(BOOL success, NSInteger code) {
if (success) {
// 语音识别开启成功后,开启智能总结
[[RCCallClient sharedRCCallClient] startSummarization:^(BOOL isSuccess, RCRTCCode code, NSString *taskId) {
if (isSuccess) {
NSLog(@"智能总结开启成功,任务 ID:%@", taskId);
// 保存 taskId,用于后续生成智能总结
self.summarizationTaskId = taskId;
} else {
NSLog(@"智能总结开启失败,错误码:%ld", (long)code);
}
}];
}
}];

关闭智能总结

您可以通过 RCCallClientstopSummarization 方法关闭智能总结。

提示

智能总结依赖语音识别服务,如果关闭语音识别,智能总结也会同时关闭。

接口原型

Objective C
- (void)stopSummarization:(nullable void(^)(BOOL isSuccess, RCRTCCode code))completion;

参数说明

参数类型说明
completionBlock停止智能总结的回调

示例代码

Objective C
[[RCCallClient sharedRCCallClient] stopSummarization:^(BOOL isSuccess, RCRTCCode code) {
if (isSuccess) {
NSLog(@"智能总结关闭成功");
} else {
NSLog(@"智能总结关闭失败,错误码:%ld", (long)code);
}
}];

生成智能总结

在智能总结任务开启后,您可以通过 RCCallClientgenerateSummarization 方法生成智能总结。该方法支持生成通话摘要、章节摘要、待办事项、话题提取等多种形式的总结内容。

接口原型

Objective C
- (void)generateSummarization:(nonnull NSString *)callId
taskId:(nonnull NSString *)taskId
startTime:(NSTimeInterval)startTime
endTime:(NSTimeInterval)endTime
config:(nullable RCRTCGenerateSummarizationConfig *)config
contentBlock:(nullable void(^)(NSString *content))contentBlock
completion:(nullable void(^)(BOOL isSuccess, RCRTCCode code))completion;

参数说明

参数类型说明
callIdNSString生成智能总结的通话 ID
taskIdNSString智能总结任务 ID,通过 didReceiveStartSummarization 回调获取到
startTimeNSTimeInterval本次需要总结的开始时间,UTC 时间戳,单位秒,传入 0,表示总结开始的时间
endTimeNSTimeInterval本次需要总结的结束时间,UTC 时间戳,单位秒,传入 0,表示当前时间,如果总结已经停止,则表示总结结束的时间
configRCRTCGenerateSummarizationConfig生成智能总结配置,详见下方 配置说明
contentBlockBlock内容回调,如果内容比较多,contentBlock 会回调多次
completionBlock结果回调

配置说明

RCRTCGenerateSummarizationConfig 配置类包含以下属性:

属性类型说明
customPromptNSString自定义提示词,最大长度 100
destLangNSString输出智能总结的目标语言代码
enableSummarizationBOOL是否输出总结摘要,即对整个通话的高度概括,默认 NO
enableSummarizationDetailsBOOL是否输出总结详情,默认 NO
enableChapterSummaryBOOL是否输出章节摘要,即按时间线或话题划分的通话段落总结,默认 NO
enableTodoListBOOL是否输出待办事项提取,自动识别通话中达成的共识和分配的任务,默认 NO
enableHashtagBOOL是否输出话题提取,默认 NO
formatRCRTCSummarizationFormat输出格式,RCRTCSummarizationFormatMarkDown 表示 MarkDown 格式,RCRTCSummarizationFormatJSON 表示 JSON 格式,默认 RCRTCSummarizationFormatMarkDown

示例代码

Objective C
// 创建智能总结配置
RCRTCGenerateSummarizationConfig *config = [[RCRTCGenerateSummarizationConfig alloc] init];
config.destLang = @"zh"; // 设置输出语言为中文
config.enableSummarization = YES; // 启用总结摘要
config.enableSummarizationDetails = YES; // 启用总结详情
config.enableChapterSummary = YES; // 启用章节摘要
config.enableTodoList = YES; // 启用待办事项提取
config.enableHashtag = YES; // 启用话题提取
config.format = RCRTCSummarizationFormatMarkDown; // 设置输出格式为 MarkDown

// 获取通话 ID
NSString *callId = self.callSession.callId;

// 生成智能总结
[[RCCallClient sharedRCCallClient] generateSummarization:callId
taskId:self.summarizationTaskId
startTime:0
endTime:0
config:config
contentBlock:^(NSString *content) {
// 接收智能总结内容,如果内容较多,此回调会多次调用
NSLog(@"智能总结内容:%@", content);
// 可以在这里拼接所有内容
[self.summarizationContent appendString:content];
}
completion:^(BOOL isSuccess, RCRTCCode code) {
if (isSuccess) {
NSLog(@"智能总结生成成功");
// 使用完整的总结内容
NSLog(@"完整总结内容:%@", self.summarizationContent);
} else {
NSLog(@"智能总结生成失败,错误码:%ld", (long)code);
}
}];

获取语音转文字

在智能总结任务开启后,您可以通过 RCCallClientgetASRContent 方法获取指定时间段的语音转文字内容。该方法可以获取通话期间的完整语音识别文本。

接口原型

Objective C
- (void)getASRContent:(nonnull NSString *)callId
taskId:(nonnull NSString *)taskId
startTime:(NSTimeInterval)startTime
endTime:(NSTimeInterval)endTime
destLang:(nullable NSString *)destLang
contentBlock:(nullable void(^)(NSString *content))contentBlock
completion:(nullable void(^)(BOOL isSuccess, RCRTCCode code))completion;

参数说明

参数类型说明
callIdNSString获取语音转文字的通话 ID
taskIdNSString智能总结任务 ID,通过 didReceiveStartSummarization 回调获取到
startTimeNSTimeInterval本次需要获取语音转文字的开始时间,UTC 时间戳,单位秒,传入 0,表示总结开始的时间
endTimeNSTimeInterval本次需要获取语音转文字的结束时间,UTC 时间戳,单位秒,传入 0,表示当前时间,如果总结已经停止,则表示总结结束的时间
destLangNSString目标语言代码,如果传入 nil,则使用默认语言
contentBlockBlock内容回调,如果内容比较多,contentBlock 会回调多次
completionBlock结果回调

示例代码

Objective C
// 获取通话 ID
NSString *callId = self.callSession.callId;

// 获取语音转文字内容
[[RCCallClient sharedRCCallClient] getASRContent:callId
taskId:self.summarizationTaskId
startTime:0
endTime:0
destLang:@"zh" // 设置目标语言为中文,传入 nil 则使用默认语言
contentBlock:^(NSString *content) {
// 接收语音转文字内容,如果内容较多,此回调会多次调用
NSLog(@"语音转文字内容:%@", content);
// 可以在这里拼接所有内容
[self.asrContent appendString:content];
}
completion:^(BOOL isSuccess, RCRTCCode code) {
if (isSuccess) {
NSLog(@"语音转文字获取成功");
// 使用完整的语音转文字内容
NSLog(@"完整语音转文字内容:%@", self.asrContent);
} else {
NSLog(@"语音转文字获取失败,错误码:%ld", (long)code);
}
}];