为什么还有余额却调用失败？

你看到“余额不足”时，不一定是余额真的为 0。平台会在请求开始前做一次费用预估。

你为什么会遇到这个问题

YeLin AI 会在你发起请求时进行预扣费。系统会按“最坏情况”预估本次请求可能消耗的费用。如果预估费用大于你的可用余额，请求会直接失败。

你可以先删掉无关内容，再重试。你也可以把长内容拆成多次请求。

模型上下文是“输入 token + 输出 token”的总和。如果你输入已经很长，就算你 max_tokens 设得很大也会失败。

你可以在 Console 查看余额。你也可以用 API 自动化查询余额。

用脚本定时查询余额。

估算不同模型的成本。