我要投稿

不要再直接把 UI 图转成代码了，先看这份 UI Spec 模板

发布日期：2026-05-19 02:28:45 浏览次数： 1508

作者：MaxKing宝藏

微信搜一搜，关注“MaxKing宝藏”

MaxKing宝藏

全栈开发者 × 量化交易 × AI 重度用户。这里记录我用 AI 提升效率、解决问题、优化流程 的真实实践，也分享工具背后的判断、踩坑和可复用方法。

有人把一张刚生成的后台图贴到群里，顺手问了一句：这图已经挺像样了，能不能直接丢给图片转代码工具？我盯着那张图看了两秒，第一反应不是“好不好看”，而是它到底有没有告诉工具，这个页面给谁用、先看什么、状态怎么补、手机端怎么折。

图确实顺，阴影、留白、层级都在，第一眼很容易让人放松警惕。可真把它放进浏览器，数据一长，卡片就开始挤；屏幕一缩，按钮和列表就互相顶；几个状态页没补齐，页面看起来就像少了骨架。那一刻会特别直观：图能给 AI 视觉结果，给不了工程判断。

那条留言其实点得很准：UI Spec 不是多写一步，而是先把结构说清楚，再让工具去画、去写、去落地。

-MaxKing.cc-

为什么不要直接把图转成代码？

这条留言最有价值的地方，不是在评价 image2，而是把真正的问题挑明了：你要交付的不是图，是页面。

很多人第一次看到 AI 生成的 UI 图，都会先被外观骗到。深色背景、柔和阴影、整齐卡片、像样的图标，放在一张图里看，确实很有完成度。

但只要把它放进真实业务里，问题很快就会冒出来：数据一长，卡片就撑；屏幕一窄，布局就塌；按钮一多，主次就乱。

这不是“AI 不行”这么简单。

更准确地说，是你给它的输入，本来就不够它做工程判断。

-MaxKing.cc-

UI Spec 到底是什么？

很多人会把“看起来像界面的图片”直接当成 UI 设计稿。这个误会很常见，因为它们第一眼确实很像。

但两者要解决的事不一样。图片主要回答“长什么样”，设计稿还要回答“怎么组织、怎么响应、怎么切换、怎么复用”。前者偏外观，后者更接近页面骨架。

一张图能告诉你颜色和氛围，却很难告诉你层级、约束和状态。

同一张图，放在大屏上看可能很完整，切到手机预览里就开始挤；占位文案看着舒服，换成真实数据以后，留白和卡片边界立刻紧起来。那种“图很稳、页面很飘”的感觉，通常就是在这里暴露的。

而前端真正要落地的，恰恰就是这些工程信息。

可以把它理解成看效果图盖房子。效果图能看出大概风格，却不会告诉你承重墙、管线、楼板和动线怎么排。页面也是一样，光有图，代码工具只能猜。

图片不是源头，它只是视觉表达。

页面能不能跑，决定权在结构，不在像素。

-MaxKing.cc-

最小可用 UI Spec 模板

前端真正需要的信息	单张图片是否提供？	缺失后的结果
组件层级嵌套	❌	页面容易被平铺成一堆 `div`，看着像，结构却散。
交互与页面状态	❌	没有 Hover、Loading、Empty、Error，页面像静止的海报。
响应式规则	❌	一到手机端就跑版，文字挤压，模块互相顶撞。
设计 Token	❌	颜色、字号、间距只能靠猜，后面很难接入统一体系。
真实数据边界	❌	占位符一换成长文本，卡片马上撑爆。

这张表的意思很简单：单张图不是不能用，而是不能单独当源头。

它可以帮你定风格、定氛围、定视觉密度，但页面落地最麻烦的部分，不在“看起来好不好看”，而在“能不能实现、能不能维护、能不能继续扩展”。

-MaxKing.cc-

为什么 image-to-code 总会跑偏

image-to-code 真正的难点，不是“把图翻译成代码”，而是“根据视觉表象猜结构”。

它看得到三个很像的卡片，却未必知道这三个卡片其实应该抽成同一个组件。它看得到一个很亮的按钮，却未必知道它是业务主操作还是次要操作。它看得到一块炫光效果，却未必知道那只是装饰，不该变成复杂的绝对定位。

所以你会看到一种很典型的结果：生成速度很快，返工也很快。第一眼觉得能用，第二眼就开始改，第三眼已经在手动重构。

问题不在于工具不会画，而在于它不知道该先理解什么。

它是在猜结构，不是在翻译结构。

-MaxKing.cc-

破局的关键，是先补 UI Spec

如果只在“图”和“代码”之间来回跳，大概率还是会回到手改。更稳的做法，是在中间补一层 UI Spec。

这一步不是什么概念包装。它要解决的，就是 AI 生成的 UI 图在落地时最容易缺掉的那层结构判断。

这层东西也不需要写得很玄。它本质上就是一份结构化界面规范，可以是 YAML，也可以是 JSON。格式不是重点，重点是先把工程判断写清楚：

1. 页面要解决什么问题。 2. 主路径和次路径分别是什么。 3. 哪些模块可以复用。 4. 哪些状态必须补齐。 5. 响应式规则怎么变。

先写结构，再谈好看。

下面这份就是我现在会先写出来的最小模板：

YAMLMaxKing.cc

page:
  name: 页面名称
  purpose: 页面目的
  target_user: 目标用户
  primary_action: 用户核心动作
  layout_type: dashboard / form / list / detail / landing

sections:
  - name: 模块名称
    purpose: 模块作用
    priority: high / medium / low
    component_type: Card / Table / Form / Tabs / Chart

states:
  - loading
  - empty
  - error
  - normal

responsive:
  desktop: 桌面端布局
  tablet: 平板端布局
  mobile: 移动端布局

visual_tokens:
  color_style: 视觉风格
  density: 信息密度
  radius: 圆角规则
  spacing: 间距规则

acceptance:
  - 验收标准 1
  - 验收标准 2

有了这层东西，gpt-image-2 之类的模型再去出图，就不再是“凭感觉画一张漂亮图”，而是围绕一套已经被约束过的结构去做视觉探索。图的角色也会变轻：它更像情绪板，不是唯一标准。

-MaxKing.cc-

用交易仪表盘举个例子

比如我要做一个交易仪表盘，我不会直接说：帮我生成一个高级的交易后台页面。

这种说法太空了，AI 很容易生成一个很酷但不一定能用的页面。

我会先写成这样：

YAMLMaxKing.cc

page:
  name: 交易仪表盘
  purpose: 帮助用户快速查看账户风险、持仓和交易信号
  target_user: 个人交易者 / 专业交易员
  primary_action: 查看当前账户风险
  layout_type: dashboard

sections:
  - name: 账户概览
    component_type: Metric Cards
    priority: high
  - name: 风险预警
    component_type: Alert Card
    priority: high
  - name: 持仓表格
    component_type: Data Table
    priority: medium
  - name: 信号面板
    component_type: Signal Cards
    priority: medium

states:
  - loading
  - empty
  - error
  - normal