跳到主要内容

AI 智能语音概述

AI智能流式语音

AI 智能流式语音识别是融云 RTC 的高级功能。该功能支持在音视频通话、音视频会议、语聊房以及直播等多种场景下实时转写音频内容。

主要功能特性

  • 多语言支持:支持超过 50 种语言的识别,包括中文、英文、日语、韩语、阿拉伯语、法语、西班牙语、泰语、印尼语等。此 AI 智能流式语音识别具有高准确率和低延迟的特点。

AI智能流式语音翻译

AI 智能流式语音翻译,是在“AI智能流式语音识别”功能基础上,增加了文本翻译功能。具备翻译延迟低,高准确等特点,支持200+语种的翻译。

全场景适用: 音视频通话:跨国亲友聊天、海外客户对接,实时翻译让对话像母语交流般自然; 多语言会议:全球团队协作、国际研讨会,主讲内容同步译成多语言,参会者各取所需,决策效率翻倍; 跨境直播:电商出海直播、文化内容输出,实时翻译帮助主播触达全球观众,打破地域与语言的流量边界。

开启翻译功能后,终端支持两种接收方式自由选择: 仅看译文:完全不懂源语言也能秒懂核心信息,高效获取内容; 原文 + 译文对照:略懂源语言时可校验翻译准确性,专业场景(如商务会议、学术研讨)更安心。

服务架构

AI 智能流式语音交互如下图所示:

alt()