抛弃繁重的服务器:零成本用 Vercel / Cloudflare 部署专属 AI API 中转网关
如果你经常折腾各种大模型,手里大概率握着一堆 API Key——OpenAI 的、Claude 的、DeepSeek 的、硅基流动的。然后在 Cursor、Chatbox 或者自己的脚本里来回切 Key、改 Base URL。偶尔哪个 Key 额度爆了或者被风控了,还得去各个客户端挨个改配置。
以前大家解决这个痛点,通常是搞个轻量云服务器,装个 Docker,跑一套 One-API 或者 New-API。但老实说,为了一个中转服务特意养一台 VPS,还要操心数据备份和被人扫端口,太重了。
其实,这种轻量级的 API 转发路由,完美契合 Serverless(无服务器)架构。今天就以最近在开源社区很火的 AI Relay 为例,手把手教你怎么白嫖 Vercel 或 Cloudflare 的边缘计算资源,零成本部署一个属于你自己的 AI API 中转网关。
方案横评:Vercel vs Cloudflare vs 本地 CLI
AI Relay 这类网关本质上干的就是接收请求、查库找 Key、转发请求。目前有三种白嫖思路,按需选择:
1. Vercel (Hobby 免费版)
•部署体验:最傻瓜,点一个按钮 Fork 仓库,填几个环境变量就完事。
•存储依赖:依赖 Upstash Redis (免费提供) 存配置。
•冷启动:Edge Runtime 冷启动极速,基本无感。
•痛点:免费版有请求量和 Redis 的容量限制。如果你是拿来做代码补全(像 Cursor 的高频请求),或者每天跑几千个 Agent 任务,容易触顶。但对于个人日常对话、轻量 API 代理,体验最好。
2. Cloudflare Pages + D1/KV
•部署体验:稍微繁琐一点,需要在 GitHub 配 Secrets,靠 GitHub Actions 自动推到 CF。
•存储依赖:用 CF 自家的 D1 数据库统计用量,KV 存配置。
•抗造程度:全球边缘节点分发,网络抗揍。CF 的免费额度极高(一天 10 万次请求),适合编码高频调用。
•痛点:CF Worker 对单次请求的 CPU 耗时有限制,如果你的上游 API 响应极度缓慢,可能会导致超时被掐断。
3. 本地 CLI 模式(硬核/隐私优先)
如果你完全不想依赖云端,它还提供了一个本地命令 airelay local:start。直接在你的 Mac 或者开发机上起一个常驻进程,连数据库都是本地的 SQLite。适合跑重度 Agent、或者多模态发大图片,不消耗任何云服务额度。
一句话总结:小白/轻量用户用 Vercel,高频打字机用 Cloudflare,重度瞎折腾用本地 CLI。
实战:5 分钟在 Vercel 部署网关
这里我们演示最省心的 Vercel 部署流程。
准备工作:
1.注册并登录 Vercel。
2.准备好你想代理的 API Key(比如一个 DeepSeek 的 Key)。
第一步:一键部署与环境变量
进入 AI Relay 的 GitHub 仓库,点击 Deploy with Vercel 按钮。
它会要求你填写三个核心的环境变量(这非常重要,关乎你的网关不被别人蹭掉):
•RELAY_API_KEY:这是你以后填在 Cursor / Chatbox 里的密码。你自己定一个强密码,比如 sk-my-super-secret-key-01。
•RELAY_ADMIN_KEY:后台管理页面的登录密码。
•RELAY_SIGNING_SECRET:用于签发临时 Key 的密钥(乱打一串字母数字即可)。
点击部署,等待 1-2 分钟。
第二步:关联 Upstash Redis (很多人卡在这里)
Vercel 本身不存数据,你要是不配 Redis,后台是登不进去的。
1.部署完成后,进入这个项目的 Vercel Dashboard。
2.顶栏点击 Storage -> 选择 Upstash for Redis。
3.选择 Free 套餐,直接创建并关联到这个项目。
Vercel 会自动把 Redis 的连接环境变量写进你的项目里,无需手动干预。
第三步:配置你的上游 Provider
1.访问你的 Vercel 域名后面加上 /admin(例如 https://your-project.vercel.app/admin)。
2.输入刚才设置的 RELAY_ADMIN_KEY 登录。
3.在 Provider Keys 里,添加你手头的 Key。比如选 DeepSeek 模板,填入你的 sk-xxx 密钥。保存并测试。
搞定。现在你的专属中转站已经上线了。
Cloudflare Pages 部署避坑指南
如果你嫌 Vercel 免费额度不够,想上 Cloudflare,部署流程会稍有不同。这里只提两个最容易踩坑的点。
避坑 1:GitHub Secrets 的权限配置
你需要在 Fork 的仓库里配置 CLOUDFLARE_API_TOKEN 和 CLOUDFLARE_ACCOUNT_ID。
去 CF 后台建 Token 的时候,千万注意权限:必须包含 Cloudflare Pages (Edit)、D1 (Edit) 和 Workers KV Storage (Edit)。漏一个,GitHub Actions 部署就会报错失败。
避坑 2:第一次构建的自动建表逻辑
在推送到 main 分支后,GitHub Actions 的脚本是全自动的,它会先在你的 CF 账号里创建 D1 数据库并建表,然后创建 KV,最后才部署代码。如果你发现部署完了无法访问后台,去 GitHub 的 Actions 日志里看看是不是 D1 建表那一步卡住了(通常是因为 Token 权限不对或者账号未实名认证)。
怎么在客户端里使用?
配置好后,怎么用?就当它是一个官方的 OpenAI 接口用。
比如在 Chatbox 里:
•API URL / Base URL:填你的网关域名加 /v1(例如:https://your-project.vercel.app/v1)。
•API Key:填你在环境变量里设置的 RELAY_API_KEY。
•模型名:直接手填上游的模型名(如 deepseek-chat 或 gpt-4o)。
高级玩法:高可用故障转移 (Fallback)
在这个后台里,你可以配置多个同级 Key。
如果你有 3 个限速的免费 API Key,你可以把它们全扔进去。AI Relay 会自动使用 Round-Robin(轮询)策略,一个请求用 KeyA,下一个用 KeyB,完美绕过单 Key 的并发限制。
如果某家服务商宕机了,它还会自动触发 Fallback,切到你设置的备用 Provider 上,你的客户端连报错都感知不到。
总结
用边缘计算白嫖 AI 网关,绝对是目前性价比最高、维护心智负担最小的方案。它把账号管理、负载均衡、用量统计全包了,而你只需要付出一个域名的成本(甚至连域名都不需要,直接用默认分配的 dev 域名也能跑)。
把散落在各处的 Key 收拢起来吧,享受一个 Endpoint 统管所有的清爽体验。
Member discussion