CONDUCTOR · ENTERPRISE PRIVATE DEPLOYMENT

把 Token 留在企业边界内,
把治理握在自己手里

Conductor:部署在企业内部的 AI 编码 TokenHub—— 统一接入、统一计量、统一治理,让外部大模型能力成为企业可运营的内部服务。

定位 私有 TokenHub 对象 企业技术决策者 日期 2026.06

02背景 / WHY NOW

背景

AI 编码进入 Agent 时代,Token 消耗正在爆炸

10–100×

编码 Agent 单任务的 token 消耗,相当于普通对话的数十倍——多轮规划、读码、改码、自验证

指数级

主流模型平台公开的 token 日调用量逐年数量级增长,编码场景是最大增量来源

A

AI 编码助手从"个人工具"变成"生产基础设施"

Claude Code、Codex 等 Agent 已深度进入研发主流程,停用即影响交付。

B

支出模式分裂:包月订阅 vs API 按量计费

高频与低频用户用量差异极大,凭证与配额分散在个人手里则严重浪费。

C

企业既要用得起,又要管得住

用量、成本、凭证、数据,四件事都需要一个统一的收口点。

03行业趋势 / TOKENHUB

行业趋势

云厂商正在把 AI 接入层做成「TokenHub」

多模型统一接入、按 token 统一计量、按组织统一管控——接入层正在成为一个独立产品品类。

国内云厂商

模型即服务 MaaS 平台

阿里云百炼、火山方舟、百度千帆等,以 token 为统一计量单位售卖多家模型,提供配额与密钥管理。

海外云厂商

企业 AI 平台

Azure AI Foundry、AWS Bedrock、Vertex AI:多模型目录 + 统一计费 + 企业级权限与审计。

中立网关

LLM Gateway 品类成型

OpenRouter、LiteLLM、Kong AI Gateway、Higress 等,统一 API、路由、限流、计量,被大量企业自建采用。

共同信号:Token 正在成为 AI 时代的标准计量单位——谁掌握 token 的入口,谁就掌握 AI 的治理权。

04问题 / THE GAP

问题

但公有 TokenHub 止步于企业边界之外

它解决了"接入多家模型",却没有解决企业内部的四个问题:

01 / 凭证裸奔

账号与凭证散落在员工个人手里

订阅账号谁注册谁持有,OAuth token 可被复制带走;员工离职,凭证无法即时回收。

02 / 用量黑盒

谁用了多少,企业无从知晓

订阅制没有企业侧账单明细;没有按人、按部门、按模型的 token 台账,无法分摊与问责。

03 / 资源错配

高价值资源与低频用户错配

人手一份,大部分额度闲置;少数重度用户又不够用——缺乏统一调度与公平分配机制。

04 / 数据外溢

代码与提示词路径不可控

经第三方中转网关意味着多一跳数据暴露面;审计日志留在别人手里,合规无抓手。

05定位 / POSITIONING

产品定位

Conductor:部署在企业边界内的私有 TokenHub

所有 AI 编码流量在企业内部收口:对内是统一的内部服务,对外是唯一的受控出口。

SOVEREIGNTY

主权

企业自有的 API 凭证统一托管于网关加密保险库,终端用户拿到的是企业内部 Key,随发随收。

METERING

计量

每一次调用精确到 token 入账:按人、按通道、按模型,形成企业自己的 token 台账。

GOVERNANCE

治理

双层配额、个人上限、公平排队、稳定性保护——让企业已购资源服务全员。

06架构 / ARCHITECTURE

架构总览

一个网关,三层收口:接入 → 治理 → 上游

员工侧 · 任意客户端

Claude Code终端 / IDE

Codex CLI终端 / IDE

Gemini CLI 及其他OpenAI 兼容接口

仅持企业内部 Key不接触真实凭证

→

CONDUCTOR GATEWAY · 企业内网

认证与内部 Key 管理签发 / 吊销 / 限权

调度与配额5h 窗口 + 周配额 + 个人软硬上限

精确计量SSE 解析,精确到 token,多方对账

凭证保险库 Vault托管企业 API Key,服务端注入

→

上游 · 多模型通道

国内备案模型通义 / 豆包 / DeepSeek / Kimi

企业自有 API客户自备合规凭证

海外模型(可选)由客户自备凭证接入

直连官方通道,不经第三方中转

员工换客户端、企业换模型,都不影响治理层——治理能力沉淀在网关,而非某个工具里。

07私有化优势 1 / 4

私有化优势 · 一

凭证与账号主权:真实凭证永不出网关

企业的 AI 凭证是花钱买来的资产,不应散落在员工个人电脑上。

01

加密保险库集中托管

企业 API 凭证经 age 加密存于 Vault,密钥仅运维手工注入,不落配置、不进 CI。

02

服务端注入,终端零接触

网关在转发时注入真实凭证,员工侧只有可随时吊销的企业内部 Key。

03

白名单出口,纵深防御

仅放行模型官方域名,杜绝凭证被带到边界外使用;多层网络管控互为兜底。

04

离职即回收

吊销内部 Key 即完成全部回收动作,无需找回账号、改密码、追 token。

08私有化优势 2 / 4

私有化优势 · 二

用量统一调度:把企业已购的 AI 资源用满、用公平

1 套

企业已购的多个 API 凭证 / 通道,由网关统一纳管与调度

0 浪费

闲置额度自动复用,高频与低频用户动态平衡,不再人手一份各自闲置

封顶

月度预算上限可配置,Agent 跑飞也不会击穿成本

2 层

5 小时滚动窗口 + 周度配额,把每个通道用满而不超限

01

企业已购资源从分散到统一

企业自有的多个订阅 / API 通道由网关统一纳管,按需公平分配,告别人手一份各自闲置。

02

成本上限锁定,无账单惊吓

月度预算封顶;相比纯按量计费,Agent 跑飞也不会击穿预算。

03

溢出与降级兜底

通道额度耗尽时自动排队、切换备用通道,体验平滑不中断。

09私有化优势 3 / 4

私有化优势 · 三

精确计量与公平调度:企业自己的 Token 台账

公有平台只给你一张总账单;Conductor 给你逐人、逐模型、逐 token 的明细账。

01

精确到 token 的真值计量

直接解析 API 响应流计量,并与各上游通道用量对账,账实相符。

02

个人软上限 + 硬上限

超软限降低调度优先级,超硬限直接拒绝——防止单人独吞整个资源池。

03

持久化公平队列

高峰期按优先级排队,网关重启不丢队列,忙闲时段策略可配置。

04

内部计费与分摊就绪

模型加权用量折算,支撑部门成本分摊、项目核算与预算管理。

10私有化优势 4 / 4

私有化优势 · 四

数据边界、审计与风控:合规握在自己手里

网关部署在企业内网,日志与审计数据一字节都不出门。

01

流量只到模型官方,不经第三方中转

与公有中转网关相比,少一跳暴露面;代码与提示词的路径完全可知。

02

全量审计留痕

谁、何时、用什么模型、消耗多少 token——审计日志留在内网,对接企业 SIEM。

03

稳定性保护

每通道并发限制 + 健康检查 + 异常告警,避免单通道故障导致全员中断。

04

可观测运维体系

Prometheus / Grafana 指标告警 + 标准化运维剧本,半夜值班也有章可循。

11对比 / PUBLIC VS PRIVATE

对比

公有 TokenHub 管「接入」,Conductor 管「企业内部」

维度	公有 TokenHub / 云厂商 MaaS	Conductor 私有部署
凭证归属	密钥托管在平台,账号在平台	凭证在企业自己的加密 Vault,终端零接触
数据路径	经平台/中转方,多一跳暴露面	内网网关直连模型官方 API
计量粒度	组织级总账单	逐人 / 逐模型 / 逐 token 明细 + 对账
内部公平	不涉及,内部分配自理	个人软硬上限 + 公平队列 + 溢出降级
资源调度	不涉及,内部分配自理	企业自有多通道统一纳管,成本封顶
审计合规	日志在平台侧,导出受限	全量审计留在内网,自主对接合规体系

两者并不互斥:公有 Hub 解决"接什么模型",私有 Hub 解决"企业内怎么用"——后者是前者落进企业的最后一公里。

12洞见 / INSIGHTS

行业洞见

我们对这个行业的四个判断

洞见一

Token 是 AI 时代的"水电煤"

AI 支出正从"按人头订阅"转向"按 token 计量"。用电要装电表,用 token 同样需要企业自己的计量器——这就是 TokenHub 兴起的根本原因。

洞见二

接入层即控制点

模型每半年换代,客户端层出不穷,唯一稳定的是企业边界上的那道网关。治理、计量、审计能力沉淀在网关上,才不会随工具更替而清零。

洞见三

编码 Agent 是 token 消耗的头号大户,也最先需要治理

Agent 自主多轮执行,单任务消耗可达对话的数十倍,预算失控最快。谁先管住编码场景,谁就掌握了企业 AI 治理的主战场。

洞见四

TokenHub 的终局是"公有 + 私有"分层

公有 Hub 负责模型供给与接入标准化,私有 Hub 负责企业内的主权、分配与合规。凡是重视代码资产的企业,最后一公里必然私有化。

13落地 / ROADMAP

落地路径

从试点到运营,三步走、低风险

第一步 · 试点 / 1–2 周

小团队验证

内网部署网关(Docker Compose 一键拉起)
接入企业已有的 2–3 个 API 凭证 / 通道,签发首批内部 Key
5–10 人试用 Claude Code / Codex,验证体验与计量

第二步 · 推广 / 1 个月

全员接入

按团队规模配置资源池与个人配额策略
启用公平队列、溢出降级与稳定性保护
管理控制台 + 监控告警上线,运维剧本就位

第三步 · 运营 / 持续

深化治理

逐人逐模型 token 台账,部门成本分摊
与上游官方用量定期对账,账实闭环
按需扩展更多模型与上游通道

员工侧零改造:继续使用熟悉的官方客户端,只需把接入地址指向网关、换上企业内部 Key。

14总结 / CLOSING

总结

云厂商把模型做成了水电,
Conductor 帮企业装上自己的电表、闸刀和保险丝。

主权 凭证不出边界 计量 token 级台账 成本 预算可控封顶 合规 审计留在内网

把 Token 留在企业边界内,把治理握在自己手里