当融入人工智能时,用户体验研究会失去信心吗?

B站影视 内地电影 2025-03-18 14:15 1

摘要:随着人工智能技术的快速发展,用户体验(UX)研究领域也迎来了新的挑战与机遇。本文通过作者亲身实践,探讨了AI在用户体验研究中的应用现状及其对研究者的影响。

随着人工智能技术的快速发展,用户体验(UX)研究领域也迎来了新的挑战与机遇。本文通过作者亲身实践,探讨了AI在用户体验研究中的应用现状及其对研究者的影响。

自 2012 年以来,我一直从事用户体验 (UX) 领域。

我的大部分工作都是以研究为导向的,这意味着我要站在网站用户、应用程序用户、设备用户的立场上……数百甚至数千人。无数小时的欢笑、沮丧,甚至泪水。

像我这样的用户研究人员在整个职业生涯中,整天、整年地向他人敞开心扉。

用户研究专业人员通常在情商测试中得分较高,并且长期以来,在很多行业中,情商被吹捧为工作成功的重要因素。

而现在……人工智能(AI)是一个闪亮的新事物,它应该会让你在职业生涯中脱颖而出。

感觉要想取得进步就必须掌握即兴写作技巧

人工智能工具的粉丝们宣称:“它可以在几分钟内完成以前需要几个小时才能完成的工作!”

在过去的几年里,我听到行业播客、网络研讨会和会议发言人告诉我们,那些拥抱人工智能并将其融入工作的专业人士将超越所有老前辈,并迎来一支新的、高度适应性强、速度极快的劳动力队伍

甚至有供应商告诉我,他们已经收集了足够多的真实用户的数据,可以预测他们对未来设计的反应。所以就像……他们在模拟测试参与者,而不是真正招募人类进行研究。

好的。

我想我需要每天练习提示写作,学习如何向人工智能提出正确的问题,并尝试识别更多可以求助于它的时机。

我猜测,一个由数千个数据点组成的工具可能能够发现一些趋势,并根据人类的记忆而不是现实安全地得出结论。

但有时在用户研究的背景下使用人工智能感觉就像撕裂自己的心一样。

“但是 Ki,”我听到你疑惑道,“你显然是在使用 AI 为这篇文章制作图片。所以你满嘴都是废话,不是吗!?”

我的答复是:

首先,你确实需要更新你的俚语。胡说八道?真的吗?其次,在 Medium 上写作并不是用户研究实践的必修课,它只是一种爱好,而且……最后,我非常希望避免成为这样的人:

这意味着我必须接受有关人工智能的事情

我必须反思它在我的工作中融入了哪些方面,并更积极地尝试如何让人工智能补充我自己的工作。

我仍然认为自己对这项技术还很陌生,并且非常不愿意让人工智能承担繁重的工作。但我想记录一些我迄今为止尝试过的人工智能 + 用户研究合作,以及我对结果的看法:

一、撰写调查/访谈脚本的初稿

我想区分完整的测试计划和脚本。测试计划包括研究目标、方法、利益相关者角色……基本上是与测试相关的所有内容。脚本是测试人员完成项目时要经历的筛选问题、说明和问题。

在攻读法学硕士之前,我与利益相关者讨论了这个项目,并制定了一套明确的目标和理想的方法。然后我将其插入老式的人工智能机器,并希望获得最好的结果。

它实际上相当不错地开发了 15 个左右的问题,但对我来说,它们感觉僵硬且正式。

我尝试告诉它这一点,但它所做的只是道歉。😆 我想,这是一个改进提示写作的教训。

AI 写的问题也相当直白,基本上就是重复我的目标/方法中的词语,然后将其重新包装成直接问题。我是转述的,但想想类似这样的东西:

我:“我们的目标是了解顾客在网上购物时面临的挑战”AI:“问题 4(开放式):您在网上购物时面临哪些挑战?”

它也没有包括后续内容或任何分支逻辑。同样,我可能会提示它做某事,但它开始感觉它很快就浪费了我的时间。

事实上,我花在编写重塑提示上的时间(然后阅读更新的版本并寻找更改)比我自己按照自己想要的方式编写调查问卷所花的时间要多。

因此对于编写测试脚本…4/10 星。除非您讨厌编写测试脚本,否则我不会推荐。如果是这样,您还是研究人员吗?

二、分析单个会话记录

我们的研究库包括逐个会话级别的 AI 分析。我打开一个上传的视频,点击那个花哨的按钮,他们的 AI 就会突出显示视频中它认为相关的时刻。

理论上是个好主意,但当我开始梳理建议的时刻时,我却一直摇头。就好像用户在抱怨网络会议工具,而不是我们正在测试的工具。或者它发现用户在转述别人的话,谈论他们有多喜欢某样东西。

视频顶部有一小块区域,我可以在其中提出一个问题,平台会尝试突出显示视频的相关片段,但我不想一个接一个地输入我的研究问题,也不想阅读并接受/拒绝每个建议

在某些时候,只需阅读一次整个成绩单并标记与我的研究目标相关的内容即可节省时间。

因此,对于分析单个用户的单独会话/数据…4/10。如果我可以一次性插入所有研究问题,并且只需对建议的重点内容进行一次审核,那么得分可能会更高。

三、分析一批用户访谈笔记

不久前,我有机会在迈阿密的一家市场研究办公室进行经典的玻璃后观察测试。

我和其他 4 个人花了 3 天时间做笔记(并喝古巴咖啡)。利益相关者希望快速获得结果,而我正准备去度假。

因此,在回家的航班上,我打开了我们的内部 LLM 工具并上传了我的笔记,看看它是否可以为我总结一些事情。

令我惊讶和高兴的是,这种方法效果非常好——我只觉得需要调整一两个要点,并且只需进行极少的重新提示。

在我去 PTO 之前,我在 AI 生成的项目符号旁边放了几张截图,并发送了电子邮件摘要。

这就是我认为此方法效果更好的原因

当我记笔记时,我已经将内容翻译成我们的内部语言。用户不断忽略特定页面上的“继续”CTA,每次发生这种情况时,我都会在笔记中以相同的方式引用该问题(“VFT 页面上的横幅失明”)。如果它一直在分析记录,我怀疑人工智能会知道人们卡住的页面名称或了解他们卡住的原因。我的笔记是大纲形式。当用户从一个主题或网站部分移动到另一个时,我会用主题或页面名称指向一个新部分,并跟踪他们说了什么和做了什么。就其本身而言,我认为人工智能无法很好地分析后者。

因此,使用 AI 分析一批会议记录8/10!如果你有(或者你是)一个坚持做笔记的人,这可能会为你节省一些时间来总结你的采访或非主持会议中的趋势。

四、总结我们多次测试过的关于某个页面、术语或功能的所有信息

再次强调,这个例子来自我们的研究存储库工具,它保存了用户体验研究、分析、实验和数字战略团队两年多来收集的有关用户的集体知识。

总会有人更换团队、加入团队或者要求我们重述我们所知道的有关我们网站某些部分的所有信息。

虽然我们的内部标签是提取信息的一种方式,但我们的存储库工具还具有 AI 汇总功能,可以让我们提出这样的问题:“用户在尝试在线构建和定价车辆时遇到了什么问题?” 几秒钟内,就会出现一份由 AI 生成的摘要,其中包含指向数据和报告的链接注释,以帮助了解情况。

在人工智能之前,这项活动通常需要一个完整的文献综述项目,这可能需要数周时间并且往往有点乏味——如果它被认为足够优先完成的话。

现在人们只需几分钟就能掌握最新知识……

…这就是让我停下来思考的原因。

因为就像我在这篇文章开头所说的那样,我们的研究中充满了丰富的情感时刻。有高潮,也有低谷。

一个故事或 5 分钟的对话就能让用户的痛苦变得生动起来,并点燃相关利益者的心火。它可以让他们集中注意力,产生动力,并有能力优先考虑对企业和客户都有益的事情。

人工智能生成的摘要能够提供这种启发的可能性有多大?

我会给予我的利益相关者信任,并希望他们不仅仅阅读人工智能生成的摘要。也许他们会点击源材料并花一点时间进行了解

但是,当对人工智能的热情赞扬与节省时间有关时,我不禁担心我们只是将其用作一种避免与用户建立真诚联系的方式

因此,当谈到使用人工智能来总结我们关于某个主题的集体知识时,我会给它6.5/10分。

五、人工智能生成的设计评估

我们的一家供应商已经对众多行业进行了数千次网页设计测试。他们针对每种设计都提出了标准化的基准测试问题。他们的参与者在这些设计的关键页面上标记了喜欢和不喜欢的内容,并附上了开放式评论来解释他们的选择。

供应商利用这些大量数据来开发新产品——你上传一个设计或提交一个链接,它会预测用户可能喜欢或不喜欢该设计的哪些方面

它还会产生一些您可能需要考虑的潜在角色(因为我们在汽车领域工作,所以我们的角色是电动汽车购物者、负责接送孩子参加体育赛事的父母、跑车爱好者等)。

这个工具还很新,我并没有期待太多。但我不得不承认……我对结果再次感到满意

例如,我上传了一个页面,在其中一个标题中使用了“badass”一词,这与我们的样式指南并不相符。

果然,它突出显示了使用“badass”的标题,并建议谨慎使用可能显得非正式和不专业的语言。

这些人物角色的名字很俗气,比如“足球妈妈苏西”(不是真的,只是一个例子),但它们也制作得相当精良。与我们自己使用的目标人群和筛选标准类似。

我对人工智能模拟用户的概念感到很反感,但无论出于什么原因,这种人工智能应用(基于真实的、最近的人类反馈)对我来说感觉没那么“不对劲”。它更像是一个幽灵或一个人的回声,而不是真实的东西……但也许它有它的用途。

我谨慎乐观的部分原因是,我确切地知道他们使用了什么方法,他们捕获了什么样的数据。成千上万的人都做过标准化的问题和活动。我在自己的项目中也看到过类似的评论,感觉很真实、很人性化。人工智能由一个清晰而封闭的数据源提供数据(至少据我所知)。

我也欣赏他们的建议和警告措辞恰当——他们不是说“用户会讨厌这个东西”;而是说“一些重视 X 的用户可能会遇到这个东西的问题”。他们提供方向性指导和思想启蒙,而不是让设计师偏离他们已经做出的选择。

虽然我不喜欢我们的设计师依赖人工智能预测的想法,但现实情况是:我们团队的设计师与研究人员的比例约为 8:1

UXR 团队没有能力要求每位设计师定期进行测试。设计师在制定强有力的测试目标或自行开展项目的能力方面存在很大差异。在这些情况下,我认为使用这样的评估工具可以作为对设计的“直觉检查” ,一种预测潜在风险的方法,或许也是一种制定更清晰的研究目标或假设的方法。

如果在关键时刻我能为设计师提供的最好的帮助就是人类洞察力的幽灵,我想我会同意的。8.5/ 10

就像我在开头所说的,优秀用户研究员的标志之一就是开放。他们自己是开放的,并且鼓励其他人也保持开放。

作为一名用户研究员,有很多事情不能也不应该由人工智能来完成。(这值得专门写一篇文章;敬请期待。)

当谈到将人工智能分层到用户研究活动中时,有时我仍然会交叉双臂并摇头。

但是现在我已经花了一些时间记录自己的经历,我感觉没有必要去对着云朵尖叫

我今年定了一个目标,放松一点,每周花一些时间学习。我已经找到了一些视频和文章,其中有提示、技巧和演示,可以让我入门并提高技能。

为这篇文章创建图片是我第一次使用人工智能图像生成器。尽管有些结果很不准确,我不得不重写提示几次,但我不得不承认:我玩得很开心!

当我看到人工智能侵入用户研究领域时,我时不时会感到沮丧。但我可以尝试接受那些有意义且感觉正确的东西。现在我意识到我甚至可能在这一过程中获得乐趣

原作者:Ki Aguero

译者:蒋昌盛

本文由 @蒋昌盛 翻译发布于人人都是产品经理。未经作者许可,禁止转载

题图来自 Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

来源:人人都是产品经理

相关推荐