Tanka · Agent level thinking
Opening

Agent 等级不是徽章,是企业 AI 产品里的成长语言。

关键不是“给 agent 评级”,而是怎么把在 Tanka 里面已经发生的 AI 使用、工具连接、SOP 沉淀、权限变化和组织反馈,整理成一个能被用户理解的成长体系。

Capability inventory

平台建设了很多真实能力。

Flow SOP Link 生态 记忆 Memo General IM(Chat) Smart Follow-up Smart Reply Deep Reply Smart Vote Smart Meeting Follow-ups Votes Audio / Video Calls Auto-translation Email Sync Action Card

等级体系的第一步,不是定义「等级梯度」,而是重新为 agent 盘点产品的「所有能力」:哪些数据能证明 agent 知道更多,哪些动作能证明它会做更多,哪些授权能证明用户更信任它,哪些结果能证明组织真的采用了它。

The problem

我们看到三个关键缺口。

01 AI 做了很多事,但没有沉淀成资产。

一个 Flow 被完成、一个 SOP 被生成、一次反馈被修正,如果没有被记录成组织资产,用户只会感到“这次帮到了我”,不会感到“这个 agent 变强了”。

02 agent 能力很强,但用户没有机会发现。

不同人使用 AI 的解锁程度天然不同。高手会不断试探,普通用户只会停留在聊天和问答。为组织设计的产品不能把能力发现交给运气。

03 组织场景需要由「使用」本身推动「能力」的进化。

只有大家用起来,数据才会流动,反馈才会进入系统,规则才会被验证,agent 才会逐渐变成组织自己的工作层。

A distinction

模型决定 intelligence,产品决定 enterprise maturity。

外部工具、内部协作和历史工作共同构成「上下文」;agent 基于这些上下文行动;行动结果沉淀为网页、Markdown、SOP、决策记录、规则和 memory,成为组织资产,形成新的上下文,让下一次执行更接近组织自身。

Model capability 通用 agent 的能力边界,主要由模型厂商定义。

推理、规划、工具调用、长上下文、多模态,这些底层能力大多来自模型本身,也通常由模型厂商结合 AGI 愿景来讲。

Enterprise maturity 企业 agent 的成熟度,可以从组织行为里提取。

它知道多少组织上下文、会做多少工作、被允许做什么、能否把一次工作沉淀为组织资产,这些是产品可以定义、计算和呈现的。

01 Context
Internal Linked
02 Workflow Action

创建 Flow、发起 vote、提醒 owner、调用工具。

03 Artifact

网页、Markdown、SOP、决策记录、规则、memory。

组织
持续学习
Framework

企业 agent 成熟度拆成四个维度。

Knowledge知识:它知道什么

组织知识接入程度,以及上下文是否能在新的工作里被复用。

  • 数据源、SOP、历史 Flow
  • 记忆数量与质量
  • 上下文关联度

Capability能力:它会做什么

agent 已经能够稳定完成的具体工作场景,而不是抽象功能点。

  • 版本验收进度追踪
  • 用户反馈归类整理
  • 可解锁能力发现

Authority权限:它被允许做什么

哪些动作已经从 ask me 升级为 always allow,信任边界如何扩大。

  • 读取、写入、执行权限
  • 自动发送内部提醒
  • 低风险动作自动允许

Ownership承担:它沉淀了什么

agent 是否把一次工作变成组织级 SOP、wiki、规则,或被人分享、采用和复用。

  • SOP 通过 verify
  • 产出物被分享和采纳
  • 被其他 agent 调用
Scoring logic

积分来自真实工作事件的持续累积。

用户在 Link 里看到的不是一组抽象指标,而是 agent 过去做过什么、现在被允许做什么、未来还能解锁什么。积分的作用,是把这些分散事件翻译成等级可以理解的证据。

知识 当新的上下文被接入、被验证、被复用时加分。

+1 表示新增了可用上下文,例如同步一条 AI work memory、保存一次用户纠正;+2 表示这份知识被验证或复用,例如 SOP 被确认有效,或历史 Flow 被下一次工作正确调用。

+1 / +2
能力 当一个具体工作场景从“可尝试”变成“可稳定使用”时加分。

+1 表示完成了一次可复用动作,例如导入 Jira issues 追踪验收进度;+2 表示这个动作成为稳定能力,例如多次成功运行、被保存为 Action Card,或被后续 Flow 继续调用。

+1 / +2
权限 当用户把更大的工作边界授权给 agent 时加分。

+1 表示低风险动作或工具边界被打开;+2 表示连续流程、定时任务或条件触发被明确授权。权限分不因为“问我审批”增长,只因为用户扩大了可自动执行的边界。

+1 / +2
承担 当 agent 产出的内容被分享、采用、复用或验证时加分。

+1 表示用户采纳并传播了产出,例如把 Kiki 生成的报告分享给产品组;+2 表示进入组织资产层,例如 SOP 通过 verify 成为组织级 SOP,或被 kiko 和其他 agent 调用。

+1 / +2
查看落地积分规则表
Product rule

等级提升应该来自可解释的事件,而不是黑盒评分。

Link 首页展示“发生了什么”,四个维度详情页解释“为什么这件事会让 agent 变成熟”。同一个功能接入后,也会因为使用阶段不同,落到不同维度。

AI work memory
Codex / Claude Code 产出同步为 AI work memory。

本地开发、调试、设计迭代和决策记录进入 Kiki 的工作记忆,提升上下文质量。

知识 +2
Reuse
Kiki 复用了上次移动端原型调试记录。

外部记忆不只是被存储,而是被用来完成新的 Flow,说明它转化成了稳定工作能力。

能力 +1
Permission
允许 Kiki 自动同步本地 AI work memory。

从手动导入变成授权范围内自动读取,代表用户扩大了 agent 可以使用的工作上下文边界。

权限 +1
Adoption
用户反馈分析报告被分享给产品组。

用户认可 agent 的产出,并把它带入团队协作;这是采纳传播,不只是个人任务完成。

承担 +1
Org asset
原型验收 checklist 被整理成团队 SOP。

一次 AI 工作产出被沉淀为组织资产,后续可以被团队、Flow 或其他 agent 复用。

承担 +2
Growth loop

等级的作用,是把使用、信任和组织学习连接起来。

Discover 让潜力可见

用户要先知道 agent 还能做什么、连接哪些工具后能解锁什么能力。能力发现不能交给少数高级用户自己摸索。

Discover → Connect → Unlock
Use · Learn · Adopt 让价值沉淀

每次使用后,完成的 Flow、创建的 SOP、反馈修正、组织采纳都要留下来,成为用户能看懂的成长证据。

Use → Learn → Org asset
Trust 让信任可配置

权限从 ask me 到 always allow,是 agent 成熟度提升最直接的用户动作,也让信任不再停留在主观感觉。

Ask me → Always allow
Close

最终我们想做的,是让企业里的 AI 从“工具能力”变成“组织能力”。

Flow 管事情,Chat 管沟通,Link 管 agent 与组织系统之间的连接、权限、等级和学习。等级设计不是为了排名,而是为了让每个用户都能看到:agent 已经创造了什么价值,还能解锁什么潜力,以及组织如何因为持续使用而真正进化。