把 Token 留在企业边界内,
把治理握在自己手里
Conductor:部署在企业内部的 AI 编码 TokenHub—— 统一接入、统一计量、统一治理,让外部大模型能力成为企业可运营的内部服务。
AI 编码进入 Agent 时代,Token 消耗正在爆炸
AI 编码助手从"个人工具"变成"生产基础设施"
Claude Code、Codex 等 Agent 已深度进入研发主流程,停用即影响交付。
支出模式分裂:包月订阅 vs API 按量计费
高频与低频用户用量差异极大,凭证与配额分散在个人手里则严重浪费。
企业既要用得起,又要管得住
用量、成本、凭证、数据,四件事都需要一个统一的收口点。
云厂商正在把 AI 接入层做成「TokenHub」
多模型统一接入、按 token 统一计量、按组织统一管控——接入层正在成为一个独立产品品类。
模型即服务 MaaS 平台
阿里云百炼、火山方舟、百度千帆等,以 token 为统一计量单位售卖多家模型,提供配额与密钥管理。
企业 AI 平台
Azure AI Foundry、AWS Bedrock、Vertex AI:多模型目录 + 统一计费 + 企业级权限与审计。
LLM Gateway 品类成型
OpenRouter、LiteLLM、Kong AI Gateway、Higress 等,统一 API、路由、限流、计量,被大量企业自建采用。
共同信号:Token 正在成为 AI 时代的标准计量单位——谁掌握 token 的入口,谁就掌握 AI 的治理权。
但公有 TokenHub 止步于企业边界之外
它解决了"接入多家模型",却没有解决企业内部的四个问题:
账号与凭证散落在员工个人手里
订阅账号谁注册谁持有,OAuth token 可被复制带走;员工离职,凭证无法即时回收。
谁用了多少,企业无从知晓
订阅制没有企业侧账单明细;没有按人、按部门、按模型的 token 台账,无法分摊与问责。
高价值资源与低频用户错配
人手一份,大部分额度闲置;少数重度用户又不够用——缺乏统一调度与公平分配机制。
代码与提示词路径不可控
经第三方中转网关意味着多一跳数据暴露面;审计日志留在别人手里,合规无抓手。
Conductor:部署在企业边界内的私有 TokenHub
所有 AI 编码流量在企业内部收口:对内是统一的内部服务,对外是唯一的受控出口。
主权
企业自有的 API 凭证统一托管于网关加密保险库,终端用户拿到的是企业内部 Key,随发随收。
计量
每一次调用精确到 token 入账:按人、按通道、按模型,形成企业自己的 token 台账。
治理
双层配额、个人上限、公平排队、稳定性保护——让企业已购资源服务全员。
一个网关,三层收口:接入 → 治理 → 上游
员工换客户端、企业换模型,都不影响治理层——治理能力沉淀在网关,而非某个工具里。
凭证与账号主权:真实凭证永不出网关
企业的 AI 凭证是花钱买来的资产,不应散落在员工个人电脑上。
加密保险库集中托管
企业 API 凭证经 age 加密存于 Vault,密钥仅运维手工注入,不落配置、不进 CI。
服务端注入,终端零接触
网关在转发时注入真实凭证,员工侧只有可随时吊销的企业内部 Key。
白名单出口,纵深防御
仅放行模型官方域名,杜绝凭证被带到边界外使用;多层网络管控互为兜底。
离职即回收
吊销内部 Key 即完成全部回收动作,无需找回账号、改密码、追 token。
用量统一调度:把企业已购的 AI 资源用满、用公平
企业已购资源从分散到统一
企业自有的多个订阅 / API 通道由网关统一纳管,按需公平分配,告别人手一份各自闲置。
成本上限锁定,无账单惊吓
月度预算封顶;相比纯按量计费,Agent 跑飞也不会击穿预算。
溢出与降级兜底
通道额度耗尽时自动排队、切换备用通道,体验平滑不中断。
精确计量与公平调度:企业自己的 Token 台账
公有平台只给你一张总账单;Conductor 给你逐人、逐模型、逐 token 的明细账。
精确到 token 的真值计量
直接解析 API 响应流计量,并与各上游通道用量对账,账实相符。
个人软上限 + 硬上限
超软限降低调度优先级,超硬限直接拒绝——防止单人独吞整个资源池。
持久化公平队列
高峰期按优先级排队,网关重启不丢队列,忙闲时段策略可配置。
内部计费与分摊就绪
模型加权用量折算,支撑部门成本分摊、项目核算与预算管理。
数据边界、审计与风控:合规握在自己手里
网关部署在企业内网,日志与审计数据一字节都不出门。
流量只到模型官方,不经第三方中转
与公有中转网关相比,少一跳暴露面;代码与提示词的路径完全可知。
全量审计留痕
谁、何时、用什么模型、消耗多少 token——审计日志留在内网,对接企业 SIEM。
稳定性保护
每通道并发限制 + 健康检查 + 异常告警,避免单通道故障导致全员中断。
可观测运维体系
Prometheus / Grafana 指标告警 + 标准化运维剧本,半夜值班也有章可循。
公有 TokenHub 管「接入」,Conductor 管「企业内部」
| 维度 | 公有 TokenHub / 云厂商 MaaS | Conductor 私有部署 |
|---|---|---|
| 凭证归属 | 密钥托管在平台,账号在平台 | 凭证在企业自己的加密 Vault,终端零接触 |
| 数据路径 | 经平台/中转方,多一跳暴露面 | 内网网关直连模型官方 API |
| 计量粒度 | 组织级总账单 | 逐人 / 逐模型 / 逐 token 明细 + 对账 |
| 内部公平 | 不涉及,内部分配自理 | 个人软硬上限 + 公平队列 + 溢出降级 |
| 资源调度 | 不涉及,内部分配自理 | 企业自有多通道统一纳管,成本封顶 |
| 审计合规 | 日志在平台侧,导出受限 | 全量审计留在内网,自主对接合规体系 |
两者并不互斥:公有 Hub 解决"接什么模型",私有 Hub 解决"企业内怎么用"——后者是前者落进企业的最后一公里。
我们对这个行业的四个判断
Token 是 AI 时代的"水电煤"
AI 支出正从"按人头订阅"转向"按 token 计量"。用电要装电表,用 token 同样需要企业自己的计量器——这就是 TokenHub 兴起的根本原因。
接入层即控制点
模型每半年换代,客户端层出不穷,唯一稳定的是企业边界上的那道网关。治理、计量、审计能力沉淀在网关上,才不会随工具更替而清零。
编码 Agent 是 token 消耗的头号大户,也最先需要治理
Agent 自主多轮执行,单任务消耗可达对话的数十倍,预算失控最快。谁先管住编码场景,谁就掌握了企业 AI 治理的主战场。
TokenHub 的终局是"公有 + 私有"分层
公有 Hub 负责模型供给与接入标准化,私有 Hub 负责企业内的主权、分配与合规。凡是重视代码资产的企业,最后一公里必然私有化。
从试点到运营,三步走、低风险
小团队验证
- 内网部署网关(Docker Compose 一键拉起)
- 接入企业已有的 2–3 个 API 凭证 / 通道,签发首批内部 Key
- 5–10 人试用 Claude Code / Codex,验证体验与计量
全员接入
- 按团队规模配置资源池与个人配额策略
- 启用公平队列、溢出降级与稳定性保护
- 管理控制台 + 监控告警上线,运维剧本就位
深化治理
- 逐人逐模型 token 台账,部门成本分摊
- 与上游官方用量定期对账,账实闭环
- 按需扩展更多模型与上游通道
员工侧零改造:继续使用熟悉的官方客户端,只需把接入地址指向网关、换上企业内部 Key。
云厂商把模型做成了水电,
Conductor 帮企业装上自己的电表、闸刀和保险丝。