阅读时间 6 分钟

抛弃繁重的服务器:零成本用 Vercel / Cloudflare 部署专属 AI API 中转网关

告别 VPS 维护,白嫖 Vercel / Cloudflare 的边缘计算资源,零成本部署一个属于你自己的多模型 AI API 中转网关。

如果你经常折腾各种大模型,手里大概率握着一堆 API Key——OpenAI 的、Claude 的、DeepSeek 的、硅基流动的。然后在 Cursor、Chatbox 或者自己的脚本里来回切 Key、改 Base URL。偶尔哪个 Key 额度爆了或者被风控了,还得去各个客户端挨个改配置。

以前大家解决这个痛点,通常是搞个轻量云服务器,装个 Docker,跑一套 One-API 或者 New-API。但老实说,为了一个中转服务特意养一台 VPS,还要操心数据备份和被人扫端口,太重了

其实,这种轻量级的 API 转发路由,完美契合 Serverless(无服务器)架构。今天就以最近在开源社区很火的 AI Relay 为例,手把手教你怎么白嫖 Vercel 或 Cloudflare 的边缘计算资源,零成本部署一个属于你自己的 AI API 中转网关。


方案横评:Vercel vs Cloudflare vs 本地 CLI

AI Relay 这类网关本质上干的就是接收请求、查库找 Key、转发请求。目前有三种白嫖思路,按需选择:

1. Vercel (Hobby 免费版)

•部署体验:最傻瓜,点一个按钮 Fork 仓库,填几个环境变量就完事。

•存储依赖:依赖 Upstash Redis (免费提供) 存配置。

•冷启动:Edge Runtime 冷启动极速,基本无感。

•痛点:免费版有请求量和 Redis 的容量限制。如果你是拿来做代码补全(像 Cursor 的高频请求),或者每天跑几千个 Agent 任务,容易触顶。但对于个人日常对话、轻量 API 代理,体验最好。

2. Cloudflare Pages + D1/KV

•部署体验:稍微繁琐一点,需要在 GitHub 配 Secrets,靠 GitHub Actions 自动推到 CF。

•存储依赖:用 CF 自家的 D1 数据库统计用量,KV 存配置。

•抗造程度:全球边缘节点分发,网络抗揍。CF 的免费额度极高(一天 10 万次请求),适合编码高频调用

•痛点:CF Worker 对单次请求的 CPU 耗时有限制,如果你的上游 API 响应极度缓慢,可能会导致超时被掐断。

3. 本地 CLI 模式(硬核/隐私优先)

如果你完全不想依赖云端,它还提供了一个本地命令 airelay local:start。直接在你的 Mac 或者开发机上起一个常驻进程,连数据库都是本地的 SQLite。适合跑重度 Agent、或者多模态发大图片,不消耗任何云服务额度。

一句话总结:小白/轻量用户用 Vercel,高频打字机用 Cloudflare,重度瞎折腾用本地 CLI。


实战:5 分钟在 Vercel 部署网关

这里我们演示最省心的 Vercel 部署流程。

准备工作

1.注册并登录 Vercel。

2.准备好你想代理的 API Key(比如一个 DeepSeek 的 Key)。

第一步:一键部署与环境变量

进入 AI Relay 的 GitHub 仓库,点击 Deploy with Vercel 按钮。

它会要求你填写三个核心的环境变量(这非常重要,关乎你的网关不被别人蹭掉):

RELAY_API_KEY这是你以后填在 Cursor / Chatbox 里的密码。你自己定一个强密码,比如 sk-my-super-secret-key-01

RELAY_ADMIN_KEY:后台管理页面的登录密码。

RELAY_SIGNING_SECRET:用于签发临时 Key 的密钥(乱打一串字母数字即可)。

点击部署,等待 1-2 分钟。

第二步:关联 Upstash Redis (很多人卡在这里)

Vercel 本身不存数据,你要是不配 Redis,后台是登不进去的。

1.部署完成后,进入这个项目的 Vercel Dashboard。

2.顶栏点击 Storage -> 选择 Upstash for Redis

3.选择 Free 套餐,直接创建并关联到这个项目。

Vercel 会自动把 Redis 的连接环境变量写进你的项目里,无需手动干预。

第三步:配置你的上游 Provider

1.访问你的 Vercel 域名后面加上 /admin(例如 https://your-project.vercel.app/admin)。

2.输入刚才设置的 RELAY_ADMIN_KEY 登录。

3.Provider Keys 里,添加你手头的 Key。比如选 DeepSeek 模板,填入你的 sk-xxx 密钥。保存并测试。

搞定。现在你的专属中转站已经上线了。


Cloudflare Pages 部署避坑指南

如果你嫌 Vercel 免费额度不够,想上 Cloudflare,部署流程会稍有不同。这里只提两个最容易踩坑的点。

避坑 1:GitHub Secrets 的权限配置

你需要在 Fork 的仓库里配置 CLOUDFLARE_API_TOKENCLOUDFLARE_ACCOUNT_ID

去 CF 后台建 Token 的时候,千万注意权限:必须包含 Cloudflare Pages (Edit)D1 (Edit)Workers KV Storage (Edit)。漏一个,GitHub Actions 部署就会报错失败。

避坑 2:第一次构建的自动建表逻辑

在推送到 main 分支后,GitHub Actions 的脚本是全自动的,它会先在你的 CF 账号里创建 D1 数据库并建表,然后创建 KV,最后才部署代码。如果你发现部署完了无法访问后台,去 GitHub 的 Actions 日志里看看是不是 D1 建表那一步卡住了(通常是因为 Token 权限不对或者账号未实名认证)。


怎么在客户端里使用?

配置好后,怎么用?就当它是一个官方的 OpenAI 接口用。

比如在 Chatbox 里:

•API URL / Base URL:填你的网关域名加 /v1(例如:https://your-project.vercel.app/v1)。

•API Key:填你在环境变量里设置的 RELAY_API_KEY

•模型名:直接手填上游的模型名(如 deepseek-chatgpt-4o)。

高级玩法:高可用故障转移 (Fallback)

在这个后台里,你可以配置多个同级 Key

如果你有 3 个限速的免费 API Key,你可以把它们全扔进去。AI Relay 会自动使用 Round-Robin(轮询)策略,一个请求用 KeyA,下一个用 KeyB,完美绕过单 Key 的并发限制。

如果某家服务商宕机了,它还会自动触发 Fallback,切到你设置的备用 Provider 上,你的客户端连报错都感知不到。

总结

用边缘计算白嫖 AI 网关,绝对是目前性价比最高、维护心智负担最小的方案。它把账号管理、负载均衡、用量统计全包了,而你只需要付出一个域名的成本(甚至连域名都不需要,直接用默认分配的 dev 域名也能跑)。

把散落在各处的 Key 收拢起来吧,享受一个 Endpoint 统管所有的清爽体验。