跳转到主要内容
你看到“余额不足”时,不一定是余额真的为 0。 平台会在请求开始前做一次费用预估。

你为什么会遇到这个问题

YeLin AI 会在你发起请求时进行预扣费。 系统会按“最坏情况”预估本次请求可能消耗的费用。 如果预估费用大于你的可用余额,请求会直接失败。

你可以按这个顺序排查

1. 先检查输入是否太长

  • 你上传了高分辨率图片或多张图片。
  • 你粘贴了大量代码或整份长文档。
  • 你的客户端开启了联网搜索插件,自动附带了很多上下文。
你可以先删掉无关内容,再重试。 你也可以把长内容拆成多次请求。

2. 再检查是否超过模型上下文

模型上下文是“输入 token + 输出 token”的总和。 如果你输入已经很长,就算你 max_tokens 设得很大也会失败。

3. 最后检查余额是否足够

你可以在 Console 查看余额。 你也可以用 API 自动化查询余额。

余额查询 API

用脚本定时查询余额。

定价

估算不同模型的成本。

常见报错对照

  • Insufficient balance for this request: 预估费用超过余额。
  • Input too long: 输入内容过长。
  • Context length exceeded: 上下文超限。

你可以怎么优化成本

  • 你先用便宜的模型做调试,例如 gpt-4o-mini
  • 你把长文本先做摘要,再把摘要喂给大模型。