AI 智能流式语音识别
该功能支持在音视频通话、音视频会议、语聊房以及直播等多种场景下实时转写音频内容。此 AI 智能流式语音识别具有高准确率和低延迟的特点。
目前支持超过 50 种语言的识别,包括中文、英文、日 语、韩语、阿拉伯语、法语、西班牙语、泰语、印尼语等,详见语言代码列表。
前置条件
AI 智能流式语音识别是融云 RTC SDK 的高级功能。若要使用,请在 AI 服务的服务购买页面开通此功能。
设置源语言
在加入房间时,您需要通过 RCRTCRoomConfig.Builder#setSrcLanguageCode 方法设置源语言。具体支持的语言请参考语言代码列表。
提示
为提高语音识别的准确度,请根据您的业务需求设置合适的源语言。默认源语言为中文。
RCRTCRoomConfig 参数说明
| 参数 | 类型 | 说明 |
|---|---|---|
srcLanguage | String | 语音识别的源语言代码,请参考语言代码列表。 |
示例代码
Java
RCRTCRoomConfig config = RCRTCRoomConfig.Builder.create()
.setSrcLanguageCode("zh") // 设置源语言
.build();
RCRTCEngine.getInstance()
.joinRoom(
"roomId",
config,
new IRCRTCResultDataCallback<RCRTCRoom>() {
@Override
public void onSuccess(final RCRTCRoom data) {
// 加入成功
}
@Override
public void onFailed(final RTCErrorCode errorCode) {
// 加入失败
}
});
注册语音识别结果回调
在加入房间成功后,您可以通过 RCRTCRoom#registerRoomListener 方法设置语音识别结果回调。通过此回调,您可以接收以下通知:
- 语音识别服务的开启和停止
- 语音识别结果