AI智能流式语音识别
该功能支持在音视频通话、音视频会议、语聊房以及直播等多种场景下实时转写音频内容。此 AI 智能流式语音识别具有高准确率和低延迟的特点。
目前支持超过 50 种语言的识别,包括中文、英文、日语、韩语、阿拉伯语、法语、西班牙语、泰语、印尼语等,详见语言代码列表。
前置条件
AI 智能流式语音识别是融云 RTC SDK 的高级功能。若要使用,请提交工单开通此功能。
设置源语言
在发起通话或接听通话前,您需要通过 RCCallClient#setSrcLanguageCode 接口设置源语言。具体支持的语言请参考语言代码列表。
提示
为提高语音识别的准确度,请根据您的业务需求设置合适的源语言。默认源语言为中文。
参数说明
参数 | 类型 | 说明 |
---|---|---|
srcLanguageCode | String | 语音识别的源语言代码,请参考语言代码列表。 |
示例代码
Java
RongCallClient.getInstance().setSrcLanguageCode("zh");
注册语音识别结果回调
在发起通话或接听通话前,您需要通过 RCCallClient#setASRListener 设置语音识别结果回调。通过此回调,您可以接收以下通知:
- 语音识别服务的开启和停止
- 语音识别结果
- 语音识别错误