API | Levon's Blog

方案概览为了给 side project 提供稳定的 LLM 接口，可以将三款免费服务拼成一套“轻量后端”——数据库用 Aiven 免费 MySQL，推理服务部署在 Hugging Face Space，API 网关由开源的 gpt-load 负责。最终实现了多密钥轮询和降级控制，不再担心某个 Key 被限速。整体架构：客户端请求 │ ├─> Hugging Face Space (gpt-load Docker 容器) │ └─ 读取 Aiven MySQL 中的密钥池 └─< LLM 响应（轮询后的结果）第一步：申请 Aiven MySQL https://aiven.io/ Aiven可以免费部署一台1核1G内存数据库注册 Aiven 账号后，新建一个 MySQL 服务，免费套餐即可。进入 Service 页面，记下主机、端口、用户名等连接信息。这些连接信息建议整理进 .env 文件中的 DATABASE_DSN，容器启动时即可直接读取。第二步：在 Hugging Face 部署 gpt-load https://huggingface.co/ https://github.com/tbphp/gpt-load 新建一个 Docker Space，镜像选择公共的 ghcr.io/tbphp/gpt-load:latest。在仓库中上传自己的 Dockerfile 与启动脚本。 ...