本篇文档主要介绍在使用大模型服务平台百炼中常见问题。
计费相关
权限相关
如何给子账号分配阿里云百炼的管理权限?
需要给子账号授权"AliyunSFMFullAccess"权限,详细操作步骤请参考RAM子账号使用方式和授权操作进行操作。
ram子账号删除后,之前子账号创建的API-KEY还能正常使用吗?
不可以,删除后API-KEY失效。
如何新增API-KEY?
a.登录阿里云百炼大模型服务平台,右上角头像位置,鼠标悬浮后,展示API-KEY,点击后进入API-KEY管理页面。
b.点击创建我的API-KEY,在对话框中选择归属业务空间后,单击确定。
说明列表上展示API-KEY密文,点击【查看】可以看到API-KEY的明文信息。
当前每个人API-KEY创建上限为10个。
子账号可以购买阿里云百炼服务吗?
需要主账号给子账号授予AliyunSFMFullAccess权限,才可以开通服务。
AdministratorAccess包含AliyunSFMFullAccess权限吗?
不包含,需要单独给子账号授予AliyunSFMFullAccess权限才可以访问阿里云百炼服务。
已给子账号授予AliyunSFMFullAccess权限,为何登录百炼控制台时无法进入?提示需要授权呢?
如需子账号登录百炼控制台,需要主账号给RAM用户授予用户角色。配置方式参考:RAM子账号使用方式和授权操作
API/SDK相关
如何查看错误码信息?
阿里云百炼模型服务的API调用将返回状态码以标识调用结果。通用状态码由阿里云百炼约定,各算法模型还可能在通用状态码的基础上增加自定义的状态码和状态信息。请通过返回结果中的
code
和status
字段定位调用成功或失败的详细信息。HTTP 返回码
错误代码 Code
错误信息 Message
(具体信息内容可能跟随场景有所变化)
含义说明
400
InvalidParameter
Required parameter(s) missing or invalid, please check the request parameters.
接口调用参数不合法。
400
InvalidParameter
Either \"prompt\" or \"messages\" must exist and cannot both be none
prompt和messages字段不能都为空。
原因可能是格式错误,例如通过HTTP调用DashScope服务(非OpenAI兼容方式)时,messages需放入input对象中,而不是与model参数并列。
{ "model": "指定模型", "input": { "messages": [ {"role": "user", "content": "你是谁"}, ] }, "parameters": { "result_format": "message" } }
400
InvalidParameter
'messages' must contain the word 'json' in some form, to use 'response_format' of type 'json_object'.
在开启JSON结构化输出功能时,未在System Message或User Message指引模型以JSON格式输出,如:“请以json格式输出。”。
400
InvalidParameter
File [id:file-fe-***********] format is not supported.
Qwen-Long模型仅限于处理纯文本格式文件,包括TXT、DOCX、PDF、EPUB、MOBI及MD文件类型。目前不支持图片或扫描文档(因其本质上是图片形式,无法直接提取文本内容)的上传。如需对图片内容进行文本提取、分析和总结,您可以使用通义千问VL模型。
400
DataInspectionFailed
data_inspection_failed
Input or output data may contain inappropriate content.
Input data may contain inappropriate content.
Output data may contain inappropriate content.
数据检查错误,输入或者输出包含疑似敏感内容被绿网拦截。
400
BadRequest.EmptyInput
Required input parameter missing from request.
请求的输入不能为空。
400
BadRequest.EmptyParameters
Required parameter "parameters" missing from request.
请求的参数不能为空。
400
BadRequest.EmptyModel
Required parameter "model" missing from request.
请求输入的模型不能为空。
400
InvalidURL
Invalid URL provided in your request.
请求的URL错误。
400
Arrearage
Access denied, please make sure your account is in good standing.
可能原因一:阿里云账号因为欠费而被拒绝访问。请前往费用与成本页面查看是否欠费或充值。
可能原因二:调用Batch接口返回该报错,是因为未开通百炼服务。请前往百炼控制台的模型广场,免费开通百炼服务,然后用百炼的API KEY进行调用。
400
UnsupportedOperation
The operation is unsupported on the referee object.
关联的对象不支持该操作(可以根据实际情况修改)。
400
FlowNotPublished
Flow has not published yet, please publish flow and try again.
流程未发布,请发布流程后再重试。
400
InvalidSchema
Database schema is invalid for text2sql.
请输入数据库Schema信息。
400
InvalidSchemaFormat
Database schema format is invalid for text2sql.
输入数据表信息格式异常。
400
FaqRuleBlocked
Input or output data is blocked by faq rule.
命中FAQ规则干预模块。
400
CustomRoleBlocked
Input or output data may contain inappropriate content with custom rule.
请求或响应内容没有通过自定义策略。
400
InternalError.Algo
Missing Content-Length of multimodal url.
URL请求的响应头信息缺失
Content-Length
字段。如果问题无法解决,请尝试使用其他图片链接。401
InvalidApiKey
invalid_api_key
Invalid API-key provided.
Incorrect API key provided.
请求中的 ApiKey 错误。
403
AccessDenied
access_denied
Access denied.
无权访问此 API,比如不在邀测中。请前往百炼控制台,在模型广场的对应模型卡片下方单击立即申请发起测试申请。
403
Workspace.AccessDenied
Workspace access denied.
无权限访问业务空间的应用或者模型。
如果调用子业务空间的模型,请参考子业务空间的模型调用。
您也可以改为使用主账号的API KEY,主账号具有所有业务空间的权限。
403
Model.AccessDenied
Model access denied.
子账号无权限访问业务空间的模型。请确认以下步骤:
调用时,是否传入了业务空间标识(目前子账号无法访问默认业务空间的应用或模型)。
是否已对子账号访问的业务空间做了授权。
是否对访问的业务空间做了模型的访问授权。
具体详情请参考文档子业务空间的模型调用的前提条件。
403
AccessDenied.Unpurchased
Access to model denied. Please make sure you are eligible for using the model.
您可能还未开通百炼服务:您需要注册或登录阿里云账号,然后前往模型广场开通模型服务。
404
WorkSpaceNotFound
WorkSpace can not be found.
用户空间信息不存在。
404
ModelNotFound
model_not_found
Model can not be found.
The model xx does not exist.
当前访问的模型不存在。
404
ModelNotFound
model_not_found
The model xx does not exist or you do not have access to it.
您还未开通百炼服务,您需要前往模型广场开通模型服务。
408
RequestTimeOut
Request timed out, please try again later.
Response timeout!
请求超时,您可尝试再次发起请求。
可能是因为输出内容很长导致超时,您可尝试采用流式输出方式发起请求。
413
BadRequest.TooLarge
Payload Too Large.
接入层网关返回请求体过大错误,如果错误是由MSE网关层直接拦截,则没有 code,并且 message 不能自定义。如果是RESTful网关拦截,则返回code。
415
BadRequest.InputDownloadFailed
Failed to download the input file: xxx.
下载输入文件失败,可能是由于下载超时、下载失败或者文件超过限额大小,错误信息可以指出更详细的内容。
415
BadRequest.UnsupportedFileFormat
Input file format is not supported.
输入文件的格式不受支持。
429
Throttling
Requests throttling triggered.
接口调用触发限流。
429
Throttling.RateQuota
Requests rate limit exceeded, please try again later.
调用频次触发限流,比如每秒钟请求次数。
429
Throttling.AllocationQuota
Allocated quota exceeded, please increase your quota limit.
一段时间调用量触发限流,比如每分钟生成Token数。
429
LimitRequests
limit_requests
You exceeded your current requests list
超出调用限制,您需等到不满足限流条件时才能再次调用,部分模型支持申请提高限额。
429
Throttling.AllocationQuota
Free allocated quota exceeded.
免费额度已经到期或者耗尽,并且该模型未支持计费访问。
429
PrepaidBillOverdue
The prepaid bill is overdue.
业务空间预付费账单到期。
429
PostpaidBillOverdue
The postpaid bill is overdue.
模型推理商品已失效。
429
CommodityNotPurchased
Commodity has not purchased yet.
业务空间未订购。
500
InternalError
internal_error
An internal error has occured, please try again later or contact service support.
内部错误。
500
InternalError.Algo
An internal error has occured during execution, please try again later or contact service support.
内部算法错误。
500
SystemError
system_error
An system error has occured, please try again later.
系统错误。
500
InternalError.Timeout
An internal timeout error has occured during execution, please try again later or contact service support.
异步任务从网关提交给算法服务层之后等待时间 3 小时,如果在这期间始终没有结果,则超时。
500
RewriteFailed
Failed to rewrite content for prompt.
调用改写prompt的大模型失败。
500
RetrivalFailed
Failed to retrieve data from documents.
文档检索失败。
500
AppProcessFailed
Failed to proceed application request.
应用流程处理失败。
500
ModelServiceFailed
Failed to request model service.
模型服务调用失败。
500
InvokePluginFailed
Failed to invoke plugin.
插件调用失败。
503
ModelUnavailable
Model is unavailable, please try again later.
模型暂时无法提供服务。
NetworkError
network_error
Can not find api-key.
环境变量配置没有生效,您可以重启客户端或IDE后重试。更多情况请参考常见问题。
如何安装SDK?
阿里云百炼目前支持Java、Python编程语言的SDK,点击安装SDK查看详情。
Assistan-API调用function call ,用户需要依次调用两个本地函数,现在支持吗?
a.目前不支持分别调用两个函数。
b.手动创建两个Assistant-API,分别分配两个Assistan-API的使用返回。
Assistant api 为什么没有memory相关的能力?Assistant api 有memory相关的能力吗?
memory是一个较为复杂的配置功能,在Assistant API 中实现较为复杂。
产品相关
如何开通阿里云百炼服务?
登录阿里云账号,访问阿里云百炼大模型服务平台。在首页/模型广场,均可点击开通模型服务,按需开通即可。详细内容请查看:产品开通。
开通阿里云百炼服务后如何关闭?
目前,阿里云百炼服务开通后暂不支持关闭。如果您通过API来调用模型/应用,您只需要在控制台的API-KEY页面中删除API-KEY即可避免后续的调用。
如何体验大模型服务?
可通过模型体验中心进行体验。
阿里云百炼和通义千问的区别是什么?
阿里云百炼是一个提供模型的平台,包含通义千问系列的模型。
如何实现业务数据隔离,使不同业务线的同学数据之间不关联?
可以通过主账号给不同子账号授予不同的业务空间权限,不同业务空间的数据互不影响,存在隔离。详细操作内容点击如何使用业务空间查看。
百炼是否保存模型调用时传入的数据?
通过模型API调用模型时,百炼不会保存对话数据。调用过程只对调用状态进行脱敏日志记录,调用结束后对明文的提示词以及应答结果进行销毁,不会保存数据。
通过Assistant API调用模型时,百炼会保存对话数据以增强用户体验,目前暂无数据失效日期。
通过百炼应用调用模型时:对话历史记录默认缓存60分钟,缓存的对话轮数通过“携带上下文轮数”参数指定。如果60分钟内发生一次对话,缓存的失效时间会往后延60分钟。如果60分钟内没有发生对话,对话历史记录将失效,即数据被销毁。
阿里云严格保护数据隐私,绝不会将您的数据用于模型训练。同时,您在构建应用或训练大模型过程中传输的数据都会经过加密,确保数据安全。
模型中心
所谓大模型参数是怎么存储的?
可以通过魔搭下载模型,会有模型结构的JSON,可以参考JSON内容。一般情况下用开源的Python组件,去解析组件,会有向量信息,可能理解会有点难度。但是可以了解存储过程。
通义千问系列模型支持多少种语言?
14种,分别是中文、英文、阿拉伯语、西班牙语、法语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语、印度尼西亚语。
当前模型可以对接结构化数据吗?比如MySQL和hive等。
当前不支持。但已经在开发中,优先对接RDS服务。
请问Qwen2、千问-MAX等模型的文字生成速度对所有用户都是固定的吗,有没有调速的途径?
这个速度不是固定的,跟线上资源和用户所有请求有关。
咱们模型限流触发后,一般需要等多长时间再次尝试呢?
这个就和具体限流值相关。比如有的客户的限流是120qpm,执行2次请求每1秒,那比如0.2秒的时候提交了2次请求,再提交就会被限流,然后需要等0.8秒。
应用中心
目前官方都支持什么类型的插件?
目前系统提供六款插件能力,分别是:Python代码解释器、计算器、图片生成。其中部分插件需要经过申请通过后才可以使用。
自定义插件能力是否会收费?
自定义插件服务目前暂时不收费,但配置智能体API时如涉及到prompt优化、应用调用及测试窗测试,则会收费。
对于我自己定义的插件或函数,assistant-api是如何理解插件或函数的参数,并使用它们的?
自定义API插件是可以理解的,会遵循协议,传给大模型,让大模型进行理解。对于函数而言,大模型会学习传入的参数信息,会返回完整的结果。
agent和assistant-api的最大区别是什么?
调整插件模型、基于上下文的理解,用户可以自己去开发,而assistant-api是可以提供各种类,方便调优。
知识检索增强(RAG)在哪些领域都得到了应用,展开说?
知识检索增强(RAG)模型凭借其强大的检索与生成能力,在问答系统、对话系统、文本摘要、知识图谱构建与推理、教育与培训、客户服务、新闻与内容创作以及智能搜索与推荐等多个领域均展现出广泛的应用潜力和价值。
在RAG检索增强应用进行测试时,会出现模型回复不准确的情况,应该如何优化?
您可以点击模型回复内容下方的问题反馈按钮,勾选问题类型并提交。也可以复制requestID,通过提交阿里云工单反馈给我们。
AI输出后包含**xxxxx**,如何给他变成加粗显示?
** **是md格式的加粗标识。您可以在前端渲染大模型生成的内容时解析md语法并做对应的渲染。
应用的回复能设置成增量的么,当前每次都在前一次的基础上的全量回复。
tream=True, # 设置输出方式为流式输出;
incremental_output=True # 增量式流式输出;
RAG检索顺序是并行还是串行有先后顺序?
并行根据每个知识库的用户配置进行检索,然后再根据得分选取topN。
百炼调用自定义插件的时候能通过模型透传header吗,我们有个场景显示透传了header,但是根据服务端返回的情况,实际上并没有透传。
不支持自定义header, 仅支持authorizarion。
数据管理
上传文件仅支持 pdf/doc/docx 文件, 请重试 错误码:140010
上传的文件为PDF格式时,请确保文件后缀为小写pdf。
上传文件接口必填的MD5参数,是什么作用?
用来验证上传的文件是否完整。
支持删除跟管理文档标签的接口吗?
新版数据中心没有文档标签功能,可以通过创建知识索引进行区分。支持删除接口,点击数据中心查看完整内容。
结构化数据中有100条数据,但导入后发现只有20条数据,是什么原因?
请确认表格中的数据中是否存在空行。产品策略中如果出现空行后面的数据将不会识别。如果第一行是空行,就会认为是空文件。