GCGatecraft AI
生产文档

生产接入文档

直接面向生产环境:认证、端点、计费与用量、错误码、限流与排障流程。

环境变量api
GATECRAFT_BASE_URL=https://api.gatecraftai.com/v1
GATECRAFT_API_KEY=ag_...
核心端点
GET /v1/models
POST /v1/chat/completions
Response Header: x-request-id
ACCESS

接入信息

接入前请确认:密钥在服务端、模型已授权、业务日志已记录请求 ID。

Base URLhttps://api.gatecraftai.com/v1
认证方式Authorization: Bearer <GATECRAFT_API_KEY>
模型列表GET /v1/models
对话接口POST /v1/chat/completions
请求体格式application/json
排障追踪响应头 x-request-id
PRICING & USAGE

计费与用量

按 token 计费,按量扣费。账单透明,调用记录可追踪。

计费单位

按输入 token 和输出 token 分别计费,合并后扣减账户余额。

扣费时点

请求完成后按实际 token 用量计算费用并扣减余额。

对账口径

以请求日志、模型、token 用量、请求 ID 作为对账依据。

计费公式(人民币)api
按量计费(生产口径)
费用 = ((输入 token / 1,000,000 × 输入单价USD)
     +  (输出 token / 1,000,000 × 输出单价USD))
     × 0.3 × 7

说明:
- 0.3:Gatecraft 结算系数(官方参考价的 30%)
- 7:汇率换算基准($1 = ¥7)
- 实际可用模型与单价以你的账号权限和控制台展示为准
字段说明
时间请求创建时间(本地时区显示)
模型本次调用使用的模型 ID
输入 token请求输入 token 数
输出 token响应输出 token 数
费用按模型费率和 token 用量计算后的实际扣费
耗时请求端到端耗时(毫秒)
请求 ID用于排障与对账的唯一追踪标识
QUICKSTART

请求示例

示例使用 Chat Completions。实际模型 ID 以 /v1/models 返回结果为准。

请求示例
POST /v1/chat/completions
curl https://api.gatecraftai.com/v1/chat/completions \
  -H "Authorization: Bearer $GATECRAFT_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5-nano",
    "messages": [
      { "role": "user", "content": "用一句话解释 Gatecraft AI。" }
    ]
  }'
MODEL PERMISSION

模型权限

模型按账号权限开放。未开通模型会返回权限错误。

查询可用模型api
curl https://api.gatecraftai.com/v1/models \
  -H "Authorization: Bearer $GATECRAFT_API_KEY"

OpenAI 系列

8 models
模型 ID权限
gpt-5.5按账号授权
gpt-5.4按账号授权
gpt-5.4-pro按账号授权
gpt-5.2按账号授权
gpt-5.4-mini按账号授权
gpt-5-mini按账号授权
gpt-5.4-nano按账号授权
gpt-5-nano按账号授权

Anthropic / Claude 系列

6 models
模型 ID权限
claude-opus-4.7按账号授权
claude-opus-4.6按账号授权
claude-opus-4.5按账号授权
claude-sonnet-4.6按账号授权
claude-sonnet-4.5按账号授权
claude-haiku-4.5按账号授权

Gemini 系列

2 models
模型 ID权限
gemini-3.1-pro按账号授权
gemini-3-flash按账号授权
STREAM

流式输出

设置 stream: true 后,接口通过 SSE 返回增量内容。

流式请求示例api
curl https://api.gatecraftai.com/v1/chat/completions \
  -H "Authorization: Bearer $GATECRAFT_API_KEY" \
  -H "Content-Type: application/json" \
  -N \
  -d '{
    "model": "claude-opus-4.7",
    "stream": true,
    "messages": [
      { "role": "user", "content": "把这段客户反馈改写成专业客服回复。" }
    ]
  }'

连接保持

客户端持续读取 SSE;不要在首个 chunk 后提前关闭连接。

重试策略

流式已开始返回内容后,不建议对同一请求自动重试。

并发占用

流式请求结束前持续占用并发额度,请按峰值评估。

ERRORS

错误码

错误体包含 error.message、error.type、error.code。

HTTPtype说明
400invalid_request_error请求体格式错误,或缺少 model / messages 等必要字段。
401authentication_errorAPI 密钥缺失、错误、已过期或已停用。
403permission_error客户状态不可用,或请求模型未开放。
429rate_limit_error超过 RPM、并发上限、月度预算,或账户余额不足。
500api_error服务端异常,请携带请求 ID 反馈。
503service_unavailable模型或上游暂不可用,请稍后重试。
错误响应示例api
{
  "error": {
    "message": "Model is not enabled for this customer.",
    "type": "permission_error",
    "code": "model_not_allowed"
  }
}
LIMITS

配额与限制

生产环境建议为每个项目配置独立配额,避免互相影响。

RPM(每分钟请求数)

限制瞬时请求速率,防止脚本异常冲量。

并发上限

限制同时运行请求数,流式请求在结束前持续占用并发。

月度预算

达到预算后暂停新请求,调整预算后恢复。

模型权限

仅可调用已开通模型,高成本模型建议单独授权。

PRODUCTION OPS

生产排障清单

接入上线前请完成以下最小项。

服务端保管密钥

密钥只放后端环境变量,不写入前端页面、客户端包或公开仓库。

记录请求 ID

每次请求记录 x-request-id、模型、状态码、耗时。

设置业务超时

客户端应设置可控超时与重试策略,避免无限等待。

区分环境密钥

测试、预发、生产使用不同密钥,避免串账与误扣费。