创建重排序请求
本接口是融云提供的语义重排序服务接口,基于预训练模型对查询文本与候选文档的相关性进行精准排序,适用于搜索结果优化、推荐系统精排、信息检索等场景。通过灵活的参数配置和模型能力,可显著提升内容与用户意图的匹配精度。
请求方法
POST: <ai-api-base-url>/llm/v1/rerank
其中,<ai-api-base-url> 为您的 API Key 所属数据中心的域名:
- 北京数据中心:
https://ai.rong-api.com - 北美数据中心:
https://ai.us-light-api.com
请求头参数
| 参数名 | 类型 | 必传 | 默认值 | 说明 |
|---|---|---|---|---|
| Authorization | string | 是 | - | 身份认证令牌,格式为 Bearer <your API key>,需替换为实际 API Key,用于验证用户权限。 |
正文参数
| 参数名 | 类型 | 是否必填 | 默认值 | 说明 |
|---|---|---|---|---|
| model | enum | 是 | - | 选择用于文档重排序的模型名称,仅支持融云官方发布模型,传入非平台模型将返回错误:“暂不支持此种模型”。平台将定期更新可用模型列表。 |
| query | string | 是 | "Apple" | 查询文本,用于对文档列表进行相关性排序。 |
| documents | string[] | 是 | [] | 待重排序的文档列表(仅支持字符串数组)。 |
| top_n | integer | 否 | - | 输出的结果数量(按相关性降序排列),未指定则返回所有文档。 |
| return_documents | boolean | 否 | false | 输出结果中是否包含原始文档文本:
|
| max_chunks_per_doc | integer | 否 | 1024 | 单个文档允许分割的最大块数。长文档会被分割为多个块进行计算,取最高分作为文档最终分数。 |
| overlap_tokens | integer | 否 | 80 | 文档分块时相邻块之间的 token 重叠数量(最大值为 80),确保语义连贯性。 |