你看到“余额不足”时,不一定是余额真的为 0。
平台会在请求开始前做一次费用预估。
你为什么会遇到这个问题
YeLin AI 会在你发起请求时进行预扣费。 系统会按“最坏情况”预估本次请求可能消耗的费用。 如果预估费用大于你的可用余额,请求会直接失败。你可以按这个顺序排查
1. 先检查输入是否太长
- 你上传了高分辨率图片或多张图片。
- 你粘贴了大量代码或整份长文档。
- 你的客户端开启了联网搜索插件,自动附带了很多上下文。
2. 再检查是否超过模型上下文
模型上下文是“输入 token + 输出 token”的总和。 如果你输入已经很长,就算你max_tokens 设得很大也会失败。
3. 最后检查余额是否足够
你可以在 Console 查看余额。 你也可以用 API 自动化查询余额。余额查询 API
用脚本定时查询余额。
定价
估算不同模型的成本。
常见报错对照
Insufficient balance for this request: 预估费用超过余额。Input too long: 输入内容过长。Context length exceeded: 上下文超限。
你可以怎么优化成本
- 你先用便宜的模型做调试,例如
gpt-4o-mini。 - 你把长文本先做摘要,再把摘要喂给大模型。