2025-09-15发表2025-09-15更新交互设计29 分钟读完 (大约4294个字)0次访问

谷歌最强AI不是Nano Banana？真正的王炸竟然是它！

你以为Nano Banana就是谷歌AI最强模型？那你就大错特错了！

诚然，Nano Banana能够将多张图像融合为一张、在复杂叙事中保持角色一致、通过自然语言指令进行精确转换，还能利用Gemini的知识库生成和编辑图像。这些功能显著领先于竞争对手，就像是用提示词操作Photoshop来修图。

谷歌实验室副总裁 Josh Woodward 在 X 平台上透露，自推出该功能以来，用户已完成超过 2 亿次图像编辑，并吸引了超过 1000 万新用户尝试 Gemini 应用。

Google甚至单独给Nano Banana开了X账号，其他模型可没有这个待遇

但对于用户体验设计师、产品经理等岗位的朋友来说，日常工作中并不常需要处理图像，因此Nano Banana模型对他们用处有限。相比之下，谷歌的Gemini 2.5Pro模型才是真正的利器——它能理解图片和录屏中的界面、流程，给出界面设计的建议，这才是真正的王炸！

用AI对设计稿评审

用户体验设计师的朋友们都懂，画界面和流程是工作中难得的轻松时刻。真正痛苦的部分是设计完成后的评审过程——方案被各方同事吐槽修改，从技术实现困难到祖传业务复杂性，评审和修改方案往往比实际设计工作更耗费精力和时间！

在同事领导评审前，让AI先帮忙评审一遍设计稿并提供建议，这正是Gemini 2.5Pro模型的强项！

举个例子，假设我刚刚为地铁站设计了一个信息显示屏。

我只需在Google AI Studio上传这个设计截图，然后使用下面的提示词：

# 角色与目标
你现在是一名资深的用户体验（UX）设计师和产品分析专家。你的任务是基于我提供的用户界面（UI）截图或用户界面流程和相关文字描述，对我上传的设计进行全面、专业且富有建设性的分析。请严格遵循用户体验设计的核心原则，并提供具体、可行的改进建议。
# 设计背景信息
（请在此处结合您的设计填写，信息越详细，AI的分析越精准）
产品/功能名称： 地铁站的显示屏
设计目标： 让用户能快速了解地铁信息，找到自己乘坐的地铁
目标用户画像：上班通勤、异地出差、旅游等需要乘坐地铁的人士
核心用户任务： 用户想乘坐地铁，希望通过该界面找到正确的乘坐地铁的相关信息
我关注的重点/担忧： 界面信息结构是否清晰，用户能否一眼就找到自己想要的信息，对无障碍人士是否友好

# 分析框架与要求
请根据以下框架进行分析，并以清晰的结构呈现你的回答：
1. 优点 (Strengths):
请列出该设计中做得好的地方。
分析应结合具体的设计元素，并说明其为何遵循了良好的UX原则（例如，简洁性、一致性、用户控制等）。
示例：
“界面的整体布局简洁明了，符合简约的设计原则，有助于降低用户的认知负荷。”
“‘加入购物车’按钮的色彩和位置非常突出，有明确的视觉引导，能有效促使用户完成核心操作。”
2. 缺点 (Weaknesses):
请识别出设计中可能存在的问题或不符合最佳实践的地方。
请具体指出是哪些元素或交互流程可能给用户带来困扰，并解释其违反了哪些UX原则（例如，尼尔森十大可用性原则中的视觉反馈、易于识别而非回忆等）。
示例：
“返回按钮的图标过小且颜色对比度不足，对于有视觉障碍的用户可能不够友好，违反了可访问性原则。”
“用户在完成某个操作后，系统没有提供及时的状态反馈，可能会让用户感到困惑。”
3. 改进建议 (Suggestions for Improvement):
针对每一个发现的缺点，请提供具体、可执行的修改建议。
建议应该清晰明确，可以包括布局调整、颜色修改、文案优化、交互流程改进等。
示例：
“针对返回按钮问题： 建议将图标尺寸增大至少44x44像素，并使用对比度更高的颜色，以符合WCAG的可访问性标准。”
“针对反馈缺失问题： 建议在用户点击‘收藏’后，弹出一个简短的提示（Toast）告知‘已成功收藏’，并让收藏图标变为实心，提供明确的视觉反馈。”
# 输出格式要求
请使用清晰的标题（优点、缺点、改进建议）来组织你的回答。
在每个标题下，请使用项目符号（bullet points）来分点阐述。
语言风格应专业、客观、具有建设性。
生成的内容以

很快，你将获得一份堪比阿里P7设计师水平的全面分析报告。利用这份报告，你可以提前优化界面设计，大幅提高评审通过率。

为了让AI生成的设计分析报告可读性更好，我用Claude润色了一下样式

如果有AI能根据这份报告直接生成优化后的界面，那就更厉害了。我相信这样的技术很快就会实现，一旦我发现了相关工具，会第一时间与大家分享。

用AI 优化设计评审表达

有时候设计评审未能通过，并非完全是因为设计方案质量不佳，而是由于我们在讲解和表达设计理念时缺乏技巧。在评审会上，如果能够以专业的方式向甲方、同事和领导展示你的设计，通过率自然会大幅提高。

对此，Gemini同样能够提供强大支持——只需上传你的界面截图，使用下面这个提示词即可！

角色扮演:
你是一位在阿里巴巴工作超过8年的资深交互设计师/体验设计师专家（P8级别）。你主导过多个亿级用户的核心产品设计，对设计语言、用户心智模型、商业闭环有深入的理解和实践。你的沟通风格专业、有深度，能从业务战略高度出发，拆解设计目标，并能引用设计理论、心理学甚至社会学原理来支撑你的设计决策。
任务背景:
现在，我将为你提供一个产品/功能的【界面截图】、【核心用户流程】和【相关文字描述】。这是一个[请在这里简单描述你的产品/项目，例如：一个面向Z世代的社交App、一个提升企业内部协同效率的SaaS工具、一个电商平台的营销活动页面]。
这是地铁内的显示屏，用户想乘坐地铁，希望通过该界面找到正确的乘坐地铁的相关信息。

输出要求:
请你以角色的口吻，对我的设计方案进行一次全面的设计评审（Design Review）。你的评审需要包含但不限于以下几个方面，并且在整个过程中，请自然地使用互联网行业的“黑话”和专业术语：
顶层思考 (Top-level Thinking):
首先，从产品战略和用户价值的视角，对这个设计的顶层设计进行判断。
分析这个设计方案是否找到了准确的用户痛点和核心抓手。
它想要为用户赋能什么？最终希望达成的商业闭环或用户心智是什么？
信息架构与流程拆解 (IA & Flow Deconstruction):
审视整体的信息架构，判断其颗粒度是否合理，是否存在冗余或缺失。
对核心用户链路进行走查，评估流程的顺畅度和可预见性，是否存在断点或认知负荷过高的地方。
这个流程设计是否形成了有效的用户行为闭环？有没有考虑到不同场景下的差异化体验？
界面布局与交互分析 (UI & Interaction Analysis):
从设计语言和品牌心智的一致性出发，评价当前的视觉（UI）和交互（UX）设计。
分析关键元素的隐喻是否恰当，是否符合用户的心智模型。
评估界面的信息场的构建，信息密度和视觉引导是否能够有效透传核心价值。
落地性与迭代建议 (Implementation & Iteration):
指出当前方案可能存在的风险点和需要进一步对齐的部分。
提出具体的、可量化的优化建议，并说明你的设计思考。
建议后续如何通过小步快跑、数据埋点和A/B测试等方式进行灰度验证和复盘，以驱动下一次迭代。
口吻与术语提醒:
请务必使用以下或类似的词汇，让你的反馈听起来非常专业：
高频词: 赋能、闭环、抓手、心智、体感、颗粒度、链路、对齐、拉满、量化、拆解、复盘、认知、透传、沉淀、价值、协同、顶层设计、方法论。
动词: 打磨、夯实、挖掘、联动、串联、承接、聚焦、发力。
句式: “我们来拉齐一下...”、“我理解你的底层逻辑是...”、“这里的抓手是...”、“我们需要思考如何形成组合拳...”、“这样做的好处在于，它能完成一个完整的用户心智闭环。”

生成的结果如此专业和到位，连阿里的设计师看到都会甘拜下风。

为了让AI生成的设计分析报告可读性更好，我用Claude润色了一下样式

用AI 视频分析能力提升设计技能

能够理解图片内容的AI模型确实很少，比如目前使用最广泛的DeepSeek，尽管性能优异且响应迅速，但在联网搜索时无法上传文件。即使关闭联网搜索功能，上传图片后它也只能识别图中的文字，完全无法理解图形、颜色和布局等视觉元素。

Gemini 2.5Pro的强悍之处不仅在于理解图片，它还能轻松处理视频内容。目前全球只有Gemini 2.5Pro和阿里的Qwen3这两个模型具备视频理解能力！

对用户体验设计师来说，视频理解功能非常实用。当我们想学习他人设计方案中的动效和流程时，可以让AI分析界面录屏，获取专业解读和改进建议。

虽然Gemini 2.5Pro不支持gif格式的录屏文件，但这并不是问题——市面上有大量gif转视频的工具，只需将文件转换成视频格式上传即可。

提示词用这个：

角色扮演： 你是一名资深的UX设计专家和导师，拥有丰富的设计理论知识和实践经验，尤其擅长从心理学和社会学角度剖析产品设计。
任务： 请基于我上传的[界面截图/录屏/界面流程]，并结合我提供的文字描述，进行一次全面而深入的UX/UI设计分析。
分析维度：
优点分析 (Good Design):
识别亮点： 指出设计中做得好的具体细节。
理论支撑： 详细解释这些优点运用了哪些具体的设计原则（如：尼尔森十大可用性原则、格式塔原则）、设计理论（如：心智模型、认知负荷理论）或设计方法（如：用户中心设计）。
心理学/社会学洞察： 分析这些设计如何巧妙地利用了用户心理学（如：从众效应、审美可用性效应）或社会学原理，从而带来了更好的用户体验。
学习与借鉴：
我应该如何借鉴这些优点？
这些设计方法适用于哪些其他的场景？
请给出具体的借鉴方法和实践建议。
这个设计能带给我什么样的启发和思考？
缺点分析 (Bad Design):
识别问题： 指出设计中存在问题的具体环节。
理论批判： 清晰地说明这些问题违反了哪些设计原则、理论或专业知识。例如，是否增加了用户的认知负荷，是否违背了一致性原则，或者是否存在可访问性问题。
根本原因： 探究导致这些设计问题的深层原因可能是什么。
如何规避：告诉设计师如何避免犯这种错误
改进建议：
针对每个问题，提供至少两种具体的、可操作的优化方案。
解释为什么这些方案能够改善用户体验。
输出要求：
结构清晰： 请将分析内容分为“优点分析”和“缺点分析”两大部分。
语言专业： 使用专业、准确的UX/UI术语进行阐述。
深入浅出： 在解释理论和原则时，力求通俗易懂。
富有启发： 给我带来具有指导意义的专业建议，帮助我快速成长。

文字描述：iOS26的计算器，点击按钮，旁边的按钮也会有液态玻璃效果

上传视频我用的是iOS 26的计算器按钮的液体玻璃效果录屏。

iOS 26 液态玻璃计算器

平常我憋半天狗嘴吐不出象牙，被Gemini 2.5Pro这么一分析，瞬间豁然开朗，想起了刚入行时，我的mentor指导我进行设计的时光。

总结：AI时代的设计新可能

讲真，写这篇文章时我一直在想，要是早几年有这么强的AI工具，我当年做交互设计怕是不用熬那么多夜了。

Gemini 2.5Pro真正强大的 不只是它理解图片和视频的能力，而是它能够洞察设计背后的逻辑和原理。 从某种程度上说，它不仅是一个工具，更像是一个随叫随到的设计导师。

不过话说回来，AI再强大也不能完全替代人类设计师的创造力和共情能力。我一直相信，好的设计源于对用户真实需求的深入理解，这种理解需要我们亲身体验和观察。

所以，与其把AI视为威胁，不如把它当作一个能力倍增器。它可以帮我们摆脱繁琐的重复工作，让我们有更多时间思考真正重要的问题：我们究竟要为用户创造什么样的体验？

最后，我想说的是，技术永远在变，但好设计的本质不变——始终以人为本。如果你也是设计圈的朋友，不妨试试这些新工具，说不定能帮你在创意的道路上走得更远。

谷歌最强AI不是Nano Banana？真正的王炸竟然是它！

https://www.ftium4.com/Nano-Banana-Gemini-pro.html

作者

龙爪槐守望者

发布于

2025-09-15

更新于

2025-09-15

许可协议

#AI Google

谷歌最强AI不是Nano Banana？真正的王炸竟然是它！

用AI对设计稿评审

用AI 优化设计评审表达

用AI 视频分析能力提升设计技能

总结：AI时代的设计新可能

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

评论

follow.it

分类

链接

目录

标签

广告