跳到主要内容

创建文本生成请求

本接口为融云提供的智能对话生成接口,基于多轮对话历史生成符合语境的 AI 回复,适用于构建聊天机器人、智能客服、对话式助手等场景。 您可调用平台提供的 LLM(大语言模型)或 VLM(视觉语言模型),利用丰富的参数配置控制生成内容的风格、随机性及结构化输出。

请求方法

POST<ai-api-base-url>/llm/v1/chat/completions

其中,<ai-api-base-url> 为您的 API Key 所属数据中心的域名。目前仅支持北京数据中心的域名:https://ai.rong-api.com

请求头参数

参数名类型必传默认值说明
Authorizationstring-身份认证令牌,格式为 Bearer <your API key>,需替换为实际 API Key,用于验证用户权限。

正文参数

参数名类型必传默认值说明
modelenum<string>-选择调用的模型名称,仅支持融云官方发布模型,传入非平台模型将返回错误:“暂不支持此种模型”。平台将定期更新可用模型列表
messagesobject[]-对话历史消息列表,包含当前对话的上下文,用于构建上下文语境,支持多轮对话追溯。长度为 1-10 个元素。
streambooleantrue是否启用流式返回。
  • true 表示随 token 实时返回(以 Server-Sent Events 形式),结束时返回 data: [DONE]
  • false 表示完整生成后一次性返回。
max_tokensinteger512生成内容的最大 token 数,范围为 1 ≤ x ≤ 16384。
enable_thinkingbooleantrue(仅适用于 Qwen3 系列模型) 思考模式开关:
  • true:启用链式推理(Chain of Thought);
  • false: 直接生成响应。
thinking_budgetinteger4096(仅适用于 Qwen3 模型) 指定思考过程(链式推理)的最大 token 预算,范围为 1 ≤ x ≤ 32768。
min_pnumber0.05(仅适用于 Qwen3 模型) 动态过滤阈值,基于 token 概率调整生成内容的随机性,范围为 0 ≤ x ≤ 1。
stopstring[] | nullnull终止生成的触发序列(最多 4 个),生成的文本不包含这些序列。长度为 1 - 4 个元素。
temperaturenumber0.7控制生成内容的随机性,值越高(如1.0)随机性越强,适合创造性内容,值越低(如0.1)越确定,适合事实性回答。
top_pnumber0.7核采样参数,通过累积概率动态调整 token 选择范围,与 temperature 共同控制随机性。
top_knumber50限制每次预测时仅考虑概率最高的 top_k 个 token,减少随机性,范围通常为正数。
frequency_penaltynumber0.5频率惩罚,抑制重复 token 的生成概率,避免内容冗余。
ninteger1生成结果的数量,返回多个结果时需去重或筛选。
response_formatobject-指定模型输出的格式,用于规范生成内容的结构。如通过{"type": "json_object"}来指定输出 JSON 结构,{"type": "text"} 指定返回为纯文本。
toolsobject[]-允许模型调用的工具列表(目前仅支持函数),最多 128 个函数,用于实现工具调用能力(如查询数据、执行计算等)。

messages 参数说明:

字段类型必传说明
roleenum<string>消息作者的角色。可选值为:system(系统)、user(用户)或assistant(助手)。
示例user
contentstring消息的内容。
示例:“如何使用融云 AI 平台 ?”

tools 参数说明:

字段类型必传说明
typeenum<string>工具类型。目前仅支持 function
可选值function
functionobject函数相关配置对象。

function 子属性:

字段类型必传说明
function.namestring要调用的函数名称。必须由字母(a-z、A-Z)、数字(0-9)、下划线或短横线组成,最长 64 字符。
function.descriptionstring函数功能描述,用于模型判断何时及如何调用该函数。
function.parametersobject函数接受的参数,以 JSON Schema 对象描述。
示例:参见指南;
格式说明:参见 JSON Schema 文档。
注意:若省略此参数,则函数参数列表为空。
function.strictboolean/null生成函数调用时是否启用严格模式验证模式。
  • 默认值false
  • 若设为 true,模型将严格遵循 parameters 中定义的 Schema(仅支持部分 JSON Schema 特性)。

请求示例

bash
  curl --location '<ai-api-base-url>/llm/v1/chat/completions' \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data '{
"model": "Pro/Qwen/Qwen2.5-7B-Instruct",
"messages": [
{
"role": "system",
"content": "请介绍一下融云 AI API 服务。"
}
],
"stream": false,
"temperature": 1.0,
"frequency_penalty": 0.0,
"presence_penalty": 0.0,
"top_p": 0.7
}'

返回结果

参数名类型说明
idstring本次请求的唯一标识符,用于追踪和调试。
choicesobject[]生成的回复列表,每个元素包含:
  • message:生成的 message 消息内容,包含: role(消息角色,如assistant) 、 content(消息内容)、reasoning_content(推理内容,仅 DeepSeek-R1 系列和 Qwen/QwQ-32B 模型支持)、tool_calls(模型生成的工具调用)
  • finish_reason:终止原因(如 stoplength 等)
usageobject资源使用统计信息,包含:
  • prompt_tokens:输入 prompt 的 token 数
  • completion_tokens:生成内容的 token 数
  • total_tokens:总 token 数
createdinteger时间戳,表示响应生成的 Unix 时间。
modelstring实际调用的模型名称,可能与入参中的模型一致或因平台调整而变化。
objectenum响应类型,固定为 chat.completion,标识为聊天完成响应。

返回结果示例

JSON
  {
"id": "<string>",
"choices": [
{
"message": {
"role": "assistant",
"content": "<string>",
"reasoning_content": "<string>",
"tool_calls": [
{
"id": "<string>",
"type": "function",
"function": {
"name": "<string>",
"arguments": "<string>"
}
}
]
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 123,
"completion_tokens": 123,
"total_tokens": 123
},
"created": 123,
"model": "<string>",
"object": "chat.completion"
}