体验设计师 AI 时代转型路径 · 深度调研

调研维度：AI 底层能力 × 行业招聘变化 × 设计师职责拆解 × 转型路径规划｜覆盖 12+ 家头部公司｜ 2026-06-08

AI能力全景

AI工具矩阵

行业变化信号

岗位消长

职责拆解

替代性分析

转型方向

真实案例

能力雷达

行动路径

OKR锚定

Harness视角

AI 底层能力与发展现状（2025-2026）

理解 AI"擅长什么 / 不擅长什么"是判断转型方向的第一步。以下按设计相关性分层梳理。

AI 目前擅长的四大能力域

能力域	具体表现	对设计的影响	成熟度
生成（Generation）	文本生成、图像生成、UI布局生成、代码生成、视频生成	设计师不再是"唯一能产出视觉方案的人"；草稿、变体、文案秒级产出	高度成熟
推理（Reasoning）	逻辑分析、上下文理解、多步骤规划、代码调试	AI 可以理解设计意图并转化为代码；但"为什么这样设计"的判断仍需人类	快速进步
评估（Evaluation）	LLM-as-judge、质量评分、A/B对比分析、启发式检查	可替代部分人工审核；但 30% 偏差率 + 无法捕捉"体验感受"	可用但需人工校准
自动化（Automation）	工作流串联、多步骤 Agent、批量处理、自动化测试	重复性设计工作（图层命名/组件搭建/标注）已大幅自动化	快速成熟中

AI 目前做不到的（设计师不可替代的护城河）

能力缺口	为什么 AI 做不到	设计师价值锚点
深度用户洞察	无法捕捉非语言信号、文化上下文、情感微妙处；NN/g 确认"合成用户无法替代真人调研"	共情力 + 质性研究 + 文化解读
战略问题定义	AI 擅长"给定目标找路径"，但不擅长"决定什么问题值得解决"	业务判断 + 优先级决策 + 约束设定
跨利益相关者协同	无法做政治协调、信任建立、说服高管	沟通力 + 影响力 + 组织嗅觉
审美与品味判断	能模仿风格但无法定义"什么是对的品味"——Cursor JD 原话：they want "taste"	设计品味 + 审美直觉 + 文化洞察
非确定性系统设计	AI 产品本身输出不确定，设计这类系统需要"没有 playbook 的原创设计"	新范式创造力 + 容错设计 + 信任建立
伦理与无障碍合规	AI 常忽略屏幕阅读器逻辑、键盘导航、对比度缺陷；无障碍诉讼增长 300%	包容性设计 + 合规审查 + 价值判断

State of AI Design 2026 报告关键发现（900+ 从业者 × 60+ 国家）：
· 设计师使用的 AI 工具数量同比翻倍
· 50% 受访者已将 AI 生成的代码推向生产环境
· 团队从"实验阶段"进入"工作流重构阶段"
· 最大痛点：输出质量一致性仍是第一大改进空间
· 新担忧：设计师创意技能退化 + 与 AI 协作的"孤独感"
— stateofaidesign.com, 2026

站酷《AI时代超级设计师研究手册》关键数据：
· 从来不用 AI 的设计师已不到 1%
· 71% 设计师工作时长反而增加（方案迭代 + 客户期望提升）
· 会 AI 工具的设计师时薪高出 28%
· AI 是"加分项"而非"替代项"——但门槛被拉高了
— 站酷 × 第一财经, 2025-10

2026 AI 设计工具能力矩阵

按"对设计师工作流的冲击程度"排列。工具不断演进，此为 2026 年 6 月快照。

Figma AI + Make

AI 写文案、草拟 UI、生成代码、原型交互、自动组件、设计系统生成器

设计核心工具已内嵌 AI

Cursor

AI-first 代码编辑器，支持从设计稿直接生成前端代码；Figma MCP 联动

设计到代码的桥梁

v0 (Vercel)

文本/截图 → React 组件 → 可部署应用；偏 UI 组件开发

PM/设计师可直接出原型

Bolt.new / Lovable

文本描述 → 完整全栈应用；Bolt 偏工程灵活性，Lovable 偏易用性

无代码全栈开发民主化

Claude / ChatGPT

长文写作、设计决策推理、用户研究分析、Rubric 设计、Prompt 工程

设计师的思维放大器

Midjourney / DALL-E 3

文本 → 高质量图片；概念探索、情绪板、视觉方向验证

视觉素材生产效率 10x

Galileo AI / Uizard

文本描述 → 完整 UI 设计稿；支持设计系统约束

初稿生产自动化

Qoder / Windsurf

AI Agent 式开发；Skill 封装可复用能力；研究+度量自动化

设计师自建工具的载体

工具趋势总结：设计-开发边界正在消融

趋势	具体变化	对设计师意味着
Figma MCP + Cursor 联动	设计稿可直接被 AI 读取并转为可运行代码	设计师的"交付物"不再止步于 Figma 标注
原型 = 默认产出	State of AI Design: "prototyping as a default output"	不会验证原型可行性的设计师将被边缘化
设计师吸收开发任务	50% 设计师已将 AI 生成代码推向生产	"能 ship"正在成为设计师新基线
Vercel 模式	"设计师草稿 → AI 实现 → 设计师精调"	设计师从"画图交付"变为"指挥+校准"

关键判断：AI 工具把"从想法到可运行原型"的时间从周级压缩到小时级。
这意味着设计师的价值不再在于"生产速度"，而在于"方向判断力"——选择做什么比怎么做更重要。

行业变化信号：招聘 / 裁员 / 新角色

综合 NN/g State of UX 2026、Tech Layoffs 数据、头部公司公开 JD 变化。

宏观信号

信号	数据	来源
大规模裁员持续	2025 年超 62,000 tech 工作被裁；2026 继续（Meta 重新分配 7000 人至 AI）	GrackerAI / NYT
NN/g: "AI Fatigue Year"	行业从 AI 狂热转入务实整合期；设计岗回暖但形态变了	NN/g State of UX 2026
角色压缩	"compressing responsibilities that were once spread across multiple specialists"	NN/g
中间层塌陷	"The Middle of UX (mid-level UI/execution) has collapsed"	LinkedIn / Rajeev Subramanian
初级岗消失	AI automates 40% of entry-level UI tasks；初级岗位被 AI 工具吞噬	WEF / Unosquare
AI 岗需求爆发	Meta 计划招聘数千 AI 岗位；各公司新增 AI 体验相关角色	MediaPost / Mercor

JD 中新增的能力要求（跨公司共性）

2026 设计岗 JD 新公式（来源：Medium Design Bootcamp 分析）：
"They want someone who has taste and can ship. Who can think in systems and move in sprints."

新增刚需能力：
· AI Literacy：理解 AI 能力边界、能与 AI 协作完成设计
· Prompt Engineering：能写 System Prompt、设计 AI 行为
· 代码能力 / Ship 能力：至少能出 HTML/CSS/React 原型
· Evaluation / 度量思维：能定义什么是"好"并量化它
· 数据自服务：SQL / 行为日志分析 / A/B 测试理解
— Design Bootcamp, 2026; 综合 Anthropic/Cursor/OpenAI JD

头部公司设计团队动向

公司	动向	信号含义
Meta	重新分配 7000 人至 AI；设计团队精简但保留战略层	执行层被 AI 替代，策略层保留
Anthropic	Claude Code PD 岗：要求"design for non-deterministic systems"	设计师必须懂 AI 系统特性
Cursor	Design Engineer：equally comfortable in Figma and code editor	设计-工程合一是产品速度的关键
Vercel	"designer sketches → AI implements → designer refines"	设计师角色 = 指挥 + 精调
OpenAI	Quantitative UXR 要求 SQL + Python + billion-row datasets	数据能力是 AI 公司 UXR 底线
字节/豆包	大量招聘 AI Evaluator + Applied AI Designer	国内 AI 产品公司在复制硅谷结构
Google	设计团队裁员后重组为更小的"AI-first product squads"	大设计团队时代结束

岗位消长地图：正在消失的 vs 正在崛起的

正在消失 / 大幅缩减的设计角色

角色	消失原因	被什么替代
初级 UI Designer	AI 自动生成 UI 草稿 + 组件库成熟 + 40% 任务可自动化	Figma AI / v0 / Galileo AI
纯视觉设计师（Pixel Pusher）	"pushing pixels" 价值归零；生成式 AI 可秒出 100 个变体	Midjourney / Figma AI / 设计系统
中级执行型产品设计师	NN/g: "中间层塌陷"——不做策略又不精通工程的设计师无处安放	角色压缩进 Senior / Design Engineer
纯交付型 UXR	只做可用性测试报告的研究员被 AI 辅助工具替代	Maze / UserTesting AI / 设计师自服务
设计标注 / 走查专员	Figma Dev Mode + AI 自动对照设计规范	自动化工具

正在崛起的新角色

新角色	职责定义	代表公司	关键能力
Design Engineer	设计 + 前端工程混合体；能画能写代码能 ship	Cursor, Vercel, Linear, Stripe	Figma + React/CSS + 系统思维
Applied AI Designer	AI 产品的交互 + Prompt + 评测 + 研究四合一	Anthropic, Cursor, Notion, 字节	设计 + Prompt + Eval + 数据
AI Experience Designer	专注 AI 交互范式设计（非确定性 UI、信任建立）	Google, Meta, Microsoft	AI 认知 + 交互设计 + 原型验证
UX Strategist / 体验战略师	从执行层升至策略层；定义问题而非画图	各大厂高级岗	商业理解 + 系统思维 + 领导力
Design Systems Architect	设计系统的工程化 + 治理 + AI 集成	Figma, Shopify, Atlassian	系统设计 + Token + 跨团队治理
AI Evaluation Designer	为 AI 产品设计度量体系 + Rubric + 质量基线	OpenAI, Anthropic, 字节	Eval 知识 + Rubric + SQL + 研究

核心判断：设计师岗位没有消失，而是在发生"两极分化"——
· 向上：策略层（UX Strategy / 体验战略）+ 新型复合角色（Design Engineer / Applied AI Designer）
· 向下被吞：纯执行层（UI打图 / 组件搭建 / 标注走查）被 AI 工具替代
· 中间层最危险："不做策略又不精通工程"的中级设计师正在被角色压缩消灭

体验设计师传统职责全拆解

将体验设计师的日常工作拆为 20+ 项具体任务，逐项评估 AI 替代程度。

职责拆解 × AI 替代度评估

工作类别	具体任务	AI 替代度	替代方式 / 工具
用户研究	编写访谈大纲	60%	Claude/GPT 可生成初稿，人类审校
	执行用户访谈	10%	AI 无法替代面对面共情和追问
	可用性测试执行	40%	Maze/UserTesting 自动化部分
	研究洞察提炼 & 决策建议	20%	AI 可辅助归类，但判断需人类
交互设计	信息架构设计	25%	需要业务理解和用户心智模型判断
	流程/交互方案设计	35%	AI 可给参考方案，但核心逻辑需人定
	新型交互范式探索（AI 交互）	5%	"没有 playbook"——纯人类创造
	响应式/多端适配方案	70%	AI + 设计系统可自动处理
视觉/UI 设计	UI 布局草稿	80%	Figma AI / Galileo 秒级生成
	组件设计与搭建	70%	设计系统 + AI 自动补全
	视觉风格定义/品牌调性	20%	需要审美判断和文化理解
	插图/图标制作	85%	Midjourney / DALL-E / SVG 生成
	设计标注与开发交付	90%	Figma Dev Mode + AI 自动化
原型 & 验证	低保真原型	75%	v0 / Figma Make / Bolt 秒级出
	高保真可交互原型	50%	Figma Make 可做，复杂逻辑仍需人
	原型方案验证与决策	15%	需要用户反馈 + 业务判断
系统 & 策略	设计系统架构与治理	15%	需要跨团队协调和长期规划
	体验策略 / 设计方向决策	5%	纯人类战略判断
	利益相关者沟通/设计评审	5%	人际影响力不可替代
度量 & 迭代	体验度量指标定义	20%	AI 可辅助但业务适配需人定
度量 & 迭代	数据分析 & 迭代决策	40%	AI 可跑分析，但决策需人类

AI 替代性分析 · 时间线与应对

设计师工作 AI 替代度分布

按工作类别汇总，展示 AI 当前已能替代的比例。

工作类别

AI 替代度（2026 年中）

趋势

视觉/UI 执行

75%

原型制作

60%

设计标注/交付

90%

用户研究执行

35%

交互设计

35%

数据分析/度量

40%

战略/系统/治理

10%

利益相关者协同

关键结论：设计师不可替代的三层价值

价值层	具体内容	为什么不可替代
第一层：方向判断	决定做什么、不做什么；定义问题优先级；设定约束条件	AI 需要人类给目标才能工作——"prompt 的 prompt"是人定的
第二层：质量校准	审美把控、品味判断、体验感受评估、AI 输出的最终裁决	"taste"无法被训练——它是长期积累的直觉
第三层：人际连接	用户共情、利益相关者影响、跨团队信任建立	AI 没有社会身份、无法建立人际信任

woshipm.com 关键判断：
"AI 没有压缩设计师的空间，而是拓宽了创意的疆域，并抬高了专业的天花板。"
设计师的角色定位从"执行者"转为"策略导演与审美校准师"——
核心职责是"定义问题、设定规则、引导 AI 并做最终的价值判断"。
— woshipm.com, 2025-12

对你的启示：
你目前的工作中，高替代度的任务（UI执行/标注/原型）占比越高，转型越紧迫。
反之，如果你的日常已偏向"策略+度量+协同"，则已在安全区内——只需补齐 AI 新技能。
你的情况：零售营销超算的设计师 + O2-KR1 AI 体验度量 → 正在从执行层向策略+度量层迁移，方向正确。

AI 时代设计师 · 5 大转型方向

基于行业变化 + AI能力分析 + 头部公司招聘信号，为体验设计师归纳 5 条可行路径。每条标注"与你的适配度"。

方向 1：Applied AI Designer / AI 体验设计师最适配你

在 AI-native 产品中，同时承担交互设计 + Prompt 工程 + 评测体系设计 + 用户研究的复合角色。设计的材料不只是像素，还包括"模型行为"本身。

Prompt Engineering Eval Rubric 设计 SQL 数据自服务 LLM-as-judge 非确定性系统设计用户研究

为什么最适配你：你正在做的 O2-KR1（AI 体验度量）+ 券超算场景 + Qoder Skill 搭建，恰好覆盖了这个方向的核心能力。
代表公司：Anthropic (Claude Code PD), Cursor, Notion AI, 字节豆包
前文详见：ai-uxr-research.html "Applied AI Designer 深度解剖" Tab

方向 2：Design Engineer / 设计工程师高适配

"Lives at the intersection of design and engineering"——能画能写代码能 ship。在 AI 时代，设计-开发边界消融后最自然产生的角色。

React / CSS / HTML Figma + Code 双栖 AI 辅助开发原型 = 产品级代码设计系统工程化

行业信号：Cursor/Vercel/Linear/Stripe 均在招此角色；"50% 设计师已将 AI 代码推向生产"说明趋势已成。
你的切入点：利用 Cursor + v0 + Qoder 快速出原型，先做"能 ship 的设计师"再往工程深度走。
门槛：需要前端代码基础（React/CSS），但 AI 工具大幅降低了这个门槛。

方向 3：UX Strategist / 体验战略师高适配

从执行层升至策略层。不再画图，而是定义问题、设定方向、协调利益相关者、用数据驱动体验决策。

商业理解问题定义数据驱动决策利益相关者管理系统化思维影响力建设

行业信号：NN/g 强调从业者向"adaptable generalists who treat UX as strategic problem solving"转型。
你的切入点：你已有 4 年+业务经验 + XYP 战略副驾 + OKR 驱动的工作方式，天然适合策略层。
注意：纯策略不做技术会失去"接地气"的信任——建议与方向 1 组合。

方向 4：Design Systems Architect / 设计系统架构师可选方向

设计系统的工程化、治理、规模化。在 AI 时代，设计系统 = AI 的"约束框架"——Token 体系、组件规则、品质基线。

Design Token 体系组件工程化跨团队治理文档 + 规范 AI 集成（MCP/API）

行业信号：Smashing Magazine 将其列为"hidden high-impact role"；Figma AI Design Systems Generator 的出现说明系统级工作正被 AI 放大而非替代。
你的切入点：如果你的团队有设计系统建设需求，这是一个"难以被裁"的位置。
门槛：需要较深的工程协作经验 + 规范化思维。

方向 5：AI Evaluation & Research / AI 度量研究专家最适配你

专注于 AI 产品的质量度量体系建设。设计 Rubric、运行评测、建立质量基线、在量化与定性之间搭建桥梁。

Eval Rubric 设计 LLM-as-judge SQL + 数据分析用户研究方法分层度量框架 AI/ML 基本认知

行业信号：Anthropic/OpenAI 均强调"rigor without rigidity"的研究者；Braintrust/DeepEval 等评测平台爆发，但缺少"设计师视角"。
你的切入点：O2-KR1 就是在做这件事！你的"四层度量模型"已与头部公司高度吻合。
差异化：市面 Eval 方案全是工程师视角，"设计师做 Eval"= 空白市场。

推荐组合策略：不要只选一个方向，而是方向 1（Applied AI Designer）+ 方向 5（AI Evaluation）作为主线，
辅以方向 3（UX Strategy）的思维高度和方向 2（Design Engineer）的工具能力。
这个组合 = "能定义问题 + 能度量质量 + 能设计方案 + 能做出原型"的全栈 AI 设计师。

真实 JD 原文 & 公司实践案例

以下为 2025-2026 年头部公司真实 JD 片段和组织实践，为转型方向提供一手证据。

Design Engineer Cursor

"You're equally comfortable in Figma and a code editor. You'll design AI interactions that feel natural, test them with real users, evaluate model outputs, and iterate — all in the same day."

Figma + Code 双栖 AI 交互设计模型输出评估日内闭环迭代

关键信号：不是"设计完交给工程"，而是"设计即工程"。同一天内完成设计→实现→评估→迭代。
来源：cursor.com/careers · Medium Design Bootcamp 引用

Design Engineer Vercel

"Strong React, TypeScript, and Next.js skills required. Our model: designer sketches the start, then AI implements, then designer refines. You need to be able to review, adjust, and ship the final product yourself."

React / TypeScript / Next.js 指挥 + 精调 Ship 能力

关键信号：Vercel 定义了 AI 时代的设计-开发新模式——"设计师起草 → AI 实现 → 设计师校准"。设计师必须能 review 代码并做最终交付。
薪资参考：$83K-$233K（来源：UI Things 2026 Design Engineering Guide）
来源：vercel.com/careers · 知乎 · Medium

Product Designer, Claude Code Anthropic

"Design end-to-end AI-powered developer experiences. We expect you to be deeply technical — able to understand model capabilities and limitations, design for non-deterministic systems, and iterate based on evaluation data rather than just user feedback."

非确定性系统设计基于 Eval 数据迭代深度技术理解 AI 能力边界认知

关键信号：这不是传统 PD——核心差异是"基于评测数据而非仅靠用户反馈做设计决策" + "为不确定性系统设计"。
来源：anthropic.com/careers

Product Designer Notion

"Design product concepts that balance vision, craft, and feasibility. You create clear, intuitive, and visually appealing interfaces for a collaborative AI workspace."

Vision + Craft + Feasibility 平衡 AI 协作空间设计系统化思维

薪资：NYC up to $260K（来源：Medium Design Bootcamp）
关键信号：Notion 强调"平衡"——不是纯视觉也不是纯工程，而是"好品味 + 可落地 + AI 原生思维"三合一。
来源：jobs.ashbyhq.com/notion

设计团队运作模式 Linear

"Linear runs a small team where every designer ships code. There is no handoff — designers own the full cycle from concept to production."

全员 ship 代码无 handoff 全周期 ownership

关键信号：Linear 是"设计师必须能 ship"理念的极致案例。设计师不交稿，而是直接把设计变成产品。这个模式正在被更多 AI-native 公司效仿。
来源：brainy.ink / The Junior Designer Crisis

国内头部公司动向

公司	动向	数据/原文	对设计师的信号
字节/豆包	AI 岗位大幅扩招 + 内部转岗热潮	"如何转岗去豆包相关岗位是不少员工经常探讨的话题"；AI 岗平均月薪 60,738 元，高出行业 26%；顶尖专家月薪突破 13 万	设计师需要主动向 AI 产品线靠拢；有 AI 能力 = 薪资溢价
腾讯	史上最大就业计划 28,000 岗 + 60% 面向技术	2025-2027 三年新增 28,000 实习岗并加大转化；"从超级个体到超级团队"组织变革报告	"超级个体"= 一人多能的 AI 增强型人才；非技术岗需技术化转型
阿里	校招 AI 岗位占比 60-90%	蚂蚁、百度、阿里校招中技术类 AI 岗占比高达六成至九成	纯设计岗位在校招中被大幅压缩；复合型 "AI + 设计" 更有机会
站酷调研	99% 设计师已用 AI；会 AI 时薪高 28%	"不用AI的设计师已不到1%"；71% 工作时长增加（迭代预期提升）	AI 已是基线不是加分项；门槛提高但市场也给了溢价

转型模式总结：从传统设计师到 AI 角色的三种路径

路径	典型起点	终点角色	关键转折点	代表公司模式
路径 A：设计 + 代码	擅长 UI/交互的设计师	Design Engineer	学会用 Cursor/v0 把设计直接变成代码；从"交稿"变为"交产品"	Vercel 模式："sketch → AI 实现 → 精调"
路径 B：设计 + AI 认知	擅长研究/策略的设计师	Applied AI Designer / AI Eval Designer	学会写 Prompt、设计 Rubric、理解模型行为；从"评界面"变为"评模型"	Anthropic 模式："design for non-deterministic systems"
路径 C：设计 + 商业	有业务理解的资深设计师	UX Strategist / 体验战略	从做方案到定方向；从画图到影响决策；AI 释放了执行精力后聚焦战略层	大厂模式：角色压缩后"留策略砍执行"

对你的判断：
你的最优路径 = 路径 B（设计 + AI 认知）为主，因为：
· 你正在做的 OKR 就是 Eval + 度量——这是路径 B 的核心实践
· 你已有 Qoder Skill 经验——工具搭建能力已满足路径 B 的需要
· 路径 A（代码）可以通过 AI 工具低成本补齐，不需要深度投入
· 路径 C（战略）是你本身就在发展的方向（XYP + 向上汇报）

实际上你是 B 为主 + C 为辅 + A 的工具能力——三条路径不冲突，可以并行积累。

5 大方向 · 能力雷达对比

8 维能力评分基于各方向 JD 要求强度（1-5），帮你判断各方向的能力投资重点。

你的当前能力 vs 目标（Applied AI Designer + AI Eval 组合）

差距聚焦：
· 最大缺口：SQL/数据（当前 2，目标 4）、Prompt/Eval（当前 2，目标 5）
· 已有优势：用户研究（4）、业务判断（4）、工具搭建（4）
· 推荐投入顺序：SQL → Rubric → Prompt → 代码能力

可执行转型路径（90 天分阶段）

基于"Applied AI Designer + AI Evaluation"组合方向，结合你当前工作节奏设计。

Phase 1：0-30 天 · 基础打通

SQL 自服务 + AI/ML 基础认知

SQL：SQLBolt（每天 20 分钟）→ 公司数据平台写 3 条业务查询
AI 概念：精读 OpenAI Model Spec + Anthropic Eval Blog + Galileo Guide
动手：用 Qoder 跑一次 LLM-as-judge demo（让 Claude 按简单 Rubric 打分）
融入工作：在券超算项目中，尝试用 SQL 查一次 AI 推荐效果数据

里程碑：能独立写 SQL 查询 + 能用自己的话解释 LLM / Eval / Rubric

Phase 2：30-60 天 · 核心产出

第一份设计师视角 Rubric + Prompt 实操

Rubric V1：选定券超算 1 个场景，按"5 步法"写出评分标准
Prompt 实操：为该场景撰写完整 System Prompt（角色+任务+约束+示例+格式）
验证：找 2 同事试标 20 条，计算 IAA，迭代至 V3
连接算法：把 Rubric 交给算法团队配置自动评分 pipeline
顺带：用 Cursor/v0 出一个评分结果可视化原型

里程碑：Rubric V3 投入使用 + 算法团队开始用你的标准跑自动评分

Phase 3：60-90 天 · 封装与影响力

Design Skill MVP + 对外输出

Skill 封装：基于 Qoder Skill，封装 xyp 度量这个体验 命令
流程：输入场景 → L1 规则检查 + L2 LLM-as-judge → 输出报告 + L3 模板 + L4 引导
试用：在 2-3 个场景跑通完整闭环
影响力：产出"AI 体验度量方法论"文档，面向 +2/+3 汇报
叙事："我们 vs 头部公司的分层度量对照"——本次调研是汇报武器

里程碑：Design Skill 可跑通 + 1 份可对外的方法论文档 + 向上汇报完成

持续：穿插进行

Design Engineer 能力渐进积累

每周用 Cursor/v0 出 1 个小原型（可以是调研报告页面、内部工具等）
HTML/CSS/React 基础通过实战积累，不需要专门学课程
目标不是"成为工程师"，而是"能把想法变成可运行的东西"

里程碑：能独立用 AI 辅助出一个可用的内部工具/原型

学习资源精选

领域	资源	形式	投入
SQL	SQLBolt (sqlbolt.com)	交互式教程	~10h
SQL	Mode Analytics SQL Tutorial	教程+练习	~8h
AI 概念	OpenAI "The Model Spec"	官方文档	2h
Eval	Galileo "Practical Guide to LLM Evaluation"	深度指南	1h
Rubric	Twine "How to Create an Evaluation Rubric"	实操指南	45min
Prompt	IBM 2026 提示工程指南	系统教程	2h
Design Eng	每周用 Cursor 出 1 个原型	Learning by doing	每周 2h
行业	State of AI Design Report 2026	年度报告	1h
行业	NN/g State of UX 2026	趋势分析	30min
持续	Anthropic / Braintrust Blog	每周 1 篇	每篇 20min

转型路径 × 你的 OKR 锚定

将转型方向与你当前 OKR 的每个 KR/KA 直接对应，确保"学习"和"工作产出"是同一件事。

O2-KR1（AI 体验度量）× 转型路径

KA	对应转型方向	做这件事 = 在练什么能力	产出物
KA1：分层度量框架	方向 5（AI Eval）	Eval 体系设计 + 分层思维 + 行业对标	框架文档 + 头部公司对照表
KA2：≥1 场景闭环	方向 1（Applied AI Designer）+ 方向 5	Rubric 写作 + SQL 取数 + LLM-as-judge 配置	Rubric V3 + 评分 pipeline + 洞察报告
KA3：≤10min Design Skill	方向 2（Design Engineer）	工具封装 + 代码能力 + Qoder Skill 开发	可运行的 Skill + 使用文档

O3（影响力建设）× 转型路径

行动	对应转型方向	具体做法
对上汇报	方向 3（UX Strategy）	"我们 vs 头部 AI 公司"对照 + "设计师不可替代价值层" 叙事
方法论输出	方向 1 + 5	"设计师视角的 AI 体验度量方法论"——填补市场空白
工具公开	方向 2	Design Skill 开源/分享 → 在设计社区建立"AI 度量"话语权

核心认知：你不需要"额外花时间转型"——
认真做好当前 OKR 的每一个 KA，就是在完成转型。

转型不是"学完再做"，而是"在做中学"：
· 做 KA1 = 练 Eval 体系设计
· 做 KA2 = 练 Rubric + SQL + Prompt
· 做 KA3 = 练 Design Engineer 能力
· 做影响力建设 = 练 UX Strategy 能力

90 天后你将具备：Applied AI Designer 的核心能力 + 一份可汇报的方法论 + 一个可运行的 Skill
这比任何"转型培训课程"都更有效。

信息源汇总

#	标题	来源	评级	用途
1	State of UX 2026: Design Deeper to Differentiate	NN/g (nngroup.com)	A	行业全景 + 设计师角色变化
2	State of AI Design Report 2026	stateofaidesign.com	A	AI 工具使用数据 + 团队变化
3	UX And Product Designer's Career Paths In 2026	Smashing Magazine	A	职业路径全景 + 转型建议
4	UI/UX Career Path: What AI Can't Replace	Unosquare	A	AI 不可替代能力分析
5	2026 Design Job Market Trends: Middle Roles Collapse	LinkedIn (Rajeev S.)	B	中间层塌陷趋势
6	Design Role Requirements Are Evolving / 2026 JD	Medium Design Bootcamp	B	JD 新能力要求
7	Operating as an AI-native Product Designer in 2026	Verified Insider	A	AI-native 设计师工作方式
8	From UX Designer to UX Engineer: The Hybrid Role	Design Systems Collective	B	Design Engineer 角色分析
9	The Design Engineer Symptom	UX Collective	A	Design Engineer 崛起原因
10	站在2025年末回望：AI没有改变设计	人人都是产品经理	B	超级设计师能力模型
11	不用AI的设计师只剩1%	站酷 × 第一财经	B	国内 AI 工具使用数据
12	解码AI时代设计师培养新范式	人民日报	B	增强智能 + 教育路径
13	Meta Reassigns 7000 Employees to AI	NYT, 2026-05	A	大厂组织变化
14	The UX Job Market in 2026: Most In-Demand Skills	UX Design Institute	B	热门技能 + 新兴角色
15	AI 体验研究员调研（前文）	本系列上一份 HTML	A	Applied AI Designer + 分层框架

Harness 视角 · 设计师为什么天然适合这个方向

Harness 是 2026 年 Agent 领域最热的新词之一。它与体验设计师的转型有极深的关联——因为 Harness 本质上就是在回答“如何把模型能力稳定地转化为用户体验”这个问题。

什么是 Harness？

核心定义：Harness = 让模型能力稳定转化为用户体验的整套运行系统。
公式：Agent = Model + Harness（不是 Model 本身）

类比：Model = 马的能力，Harness = 缰绳 + 辔具 + 驭手 + 路线规划 + 安全保证。
没有 Harness，马只能乱跑。

Harness 包含什么？

组件	功能	设计师可介入的点
Prompt	给模型的输入指令	Prompt 设计 = 行为规范定义
Context	给模型的上下文环境	Context Engineering = 为模型搭建工作环境
Memory	跨会话记忆与状态	设计记忆策略 = 设计用户关系
Tools	可调用的外部工具/拀件	定义工具描述 = 设计 Agent 能力边界
Workflow	任务分解、执行顺序、分支逻辑	流程设计 = 体验流程设计
Permissions	权限控制、确认机制	信任设计 = 决定何时请求用户确认
Evaluation	自动化评测、质量监控	评测体系设计 = 体验度量
Reflection	Agent 自我检查输出	反思策略设计 = 确保行为质量
Retry / Recovery	失败重试、异常恢复	容错体验设计 = 用户不感知到失败

为什么 Harness 突然变得重要？

模型能力已趋近天花板（GPT-5 / Claude Opus / Gemini / Qwen 差距缩小）。
同一个模型，仅仅修改 Harness，就能带来 10%+ 任务完成率提升。

研究界提出：不应该只比较模型，而应该比较 Model + Harness Configuration。
这意味着：真正决定 AI 产品体验的，不是模型本身，而是 Harness。

四个研究方向

方向	核心问题	代表 / 关键词	成熟度
Evaluation Harness	AI 好不好？	lm-eval-harness / HELM / LangSmith / DeepEval / Ragas	最成熟
Agent Harness	Agent 如何工作？	Tool Use / Planning / Memory / Reflection / Recovery	前沿
Harness Engineering	如何做得更好？	权限系统 / 任务分解 / 上下文管理 / 失败恢复 / 观测	2026 最热
Self-Harness	AI 如何自我优化？	发现失败 → 分析 → 修改策略 → 重测	最前沿

从体验设计角度理解 Harness

传统 UX	AI 时代 Harness	对应关系
设计用户流程（首页→搜索→商品页→下单）	设计 Agent 流程（理解需求→确认→规划→执行→验证→反馈）	对象从用户变为 Agent
定义交互规范（点击、滑动、反馈）	定义行为规范（何时追问、共情、确认、停止）	从界面规范到行为规范
可用性测试（用户能不能完成任务）	Evaluation Harness（Agent 能不能达到质量基线）	从可用性到行为质量
设计引导/空状态/错误提示	设计失败恢复/重试策略/优雅降级	从 UI 容错到系统容错
A/B 测试 + 埋点分析	Harness A vs B 对比实验	从界面优化到工作流优化

关键洞察：很多 Harness 工作其实越来越像 UX。
这已经不是 UI Design，而是——Cognitive Experience Design（认知体验设计）。
你需要设计：Agent 怎么理解任务、怎么决策、怎么反思、怎么向用户确认、什么时候停止。

为什么体验设计师天然适合 Harness 设计？

设计师已有的能力	在 Harness 中的作用	工程师通常缺少的
行为设计 (Behavior Design)	定义 Agent 在不同场景下应有的行为	工程师写 Step1→Step2→Step3，但不会问“用户此刻感受是什么”
共情力 + 用户研究	设计“先共情→再确认需求→再给建议”的行为模式	工程师倾向于“识别问题→直接给方案”
体验度量思维	设计 Evaluation Rubric，定义“好”的标准	工程师只看“跑通”，设计师看“体验好不好”
流程设计能力	设计 Agent 的决策树和分支逻辑	体验设计师天然习惯“如果这样则如何”的思维
利益相关者管理	在用户/产品/工程之间翻译 Harness 需求	工程师往往在单一视角内工作

举例：用户说“我最近工作压力好大”。

工程师设计的 Harness：识别压力 → 提供建议
体验设计师设计的 Harness：识别压力 → 表达理解 → 确认是否需要建议 → 再给建议

结果可能完全不同。而这种差异：恰恰来自 Harness。

四层能力阶梯（体验设计师视角）

层级	方向	核心问题	你当前状态
第一层	Experience Metrics	如何定义“好”？	✅ 已在做（体验指标体系）
第二层	Evaluation Harness	如何自动化度量？	✅ 正在做（O2-KR1）
第三层	Agent Behavior Design	追问/确认/共情/建议的行为模式库	⚠️ 待探索
第四层	Experience Harness	体验设计 + Agent 工作流 + 评测融合	⚠️ 未来 2-3 年最有价值方向

未来角色演进

角色	职责	与你的关联
Agent Experience Designer	设计 Agent 行为、定义交互范式	你的 Applied AI Designer 方向
Evaluation Designer	设计评测体系、Rubric、质量基线	你的 AI Eval 方向
Harness Designer	设计 Agent 运行机制（工作流+权限+失败恢复）	= Experience Harness Designer
AI Product Researcher	研究用户和 Agent 协同模式	你的用户研究背景直接适用

Harness 视角的核心升级：

Harness 不只是让 AI 更符合预期，而是把“预期中的体验”转化成 Agent 可以执行、可以评估、可以迭代的一套行为系统。

你正在做的 Emotion Evaluation，其实已经站在了 Harness 思维的入口处。
很多体验设计师还在研究界面时，你已经开始研究“如何定义、测量和塑造 AI 的行为质量”——
这恰恰是 Harness Engineering 与 Experience Design 未来最有可能交汇的地方。

实质：在 AI 产品里，未来体验设计师越来越像是在设计一个“数字员工的行为体系”。
而 Harness 正是把这些行为原则、评估标准和优化机制连接起来的基础设施。