又不想回答不知道,就在现场编造了一个看似有理有据的理由,或者他们有讨好访谈者的心理,会回答他们觉得你希望听到的答案,而不是自己真正的想法 2。对我们来说,防止被骗的方法恐怕像索尼一样,尽量在用户可以和产品发生交互的场合下进行,让用户在“说”的同时也“做”,只不过,这样访谈的成本会明显高于电话访谈或邀请用户来公司的会议室访谈。另外,我们也可以注意区分用户说的事实与观点,一般来说,诸如“我做了什么,步骤如何,碰到了什么问题”这类事实的可信度更高一些,而“我觉得、我认为”这类的观点,则需要带着大大的问号去听。第二,样本少,以偏概全的问题。选择样本的时候需要多加注意,尽量做到随机,举几个常见的“不随机”的例子。比如为了成本考虑,我们上门访谈的时候只找了本市的用户,这样很可能得出一些与地域有关的错误推论;又如电话访谈时,为了提高联系成功率,我们优先拨打留了手机的用户,而留手机很可能代表这批用户忠诚度已经比较高;再如邀约用户来公司访谈,“愿意来的用户”,就已经和全体用户有差异了……对于这个问题,我常用的几个对策如下。首先,我们应该尽量识别出各种可能引起偏差的因素,并在访谈的报告里标明,让读者了解。然后,为了用尽可能少的样本得到尽可能正确的结论,我会以增量的方式做访谈。举个例子,我会先访谈 5 个用户,得出基本结论,然后再访谈 5 个,观察结论是否有改变,如果有改变,就继续加大样本量,或者思考问题是否合适?样本集是否合适?如果没有改变,就停止继续访谈,节省成本。样本的选取,其实属于概率与数理统计的范畴,想深入的同学可以自行研究。第三,用户过于强势,把我们往沟里带。我在 2006 年底做网店版的用户访谈的时候,就经常犯这个错误:2 这些原因都很有意思,想深入研究的同学可以去看社会心理学里有详细的里的相关论述。当时我们找来了很多淘宝的大卖家,问了几个问题以后,那些卖家的情绪就被调动起来了,似乎好不容易有个倾诉者来听他们创业过程中的成就与艰辛,然后就开始讲故事,比如卖水货手机的帅哥给你讲中国整个水货手机市场,第一级只有深圳的几个人,每天凌晨两点他们会在某个秘密地点出货给第二级,都是以“百台”为单位叫价,和古老的证券交易所一样,然后四点左右第二级就会把当天的价格传真给他……改天又来一位卖钻石的少妇给你讲他老公多有钱,就是没空陪她,给她在上海最繁华的地段买了个门店卖钻石,她经常去南非采购,一次买好多,轮着带,不喜欢的就折价卖掉,不为赚钱就是找点事情做……真假不论,反正都是无比精彩,我们又不够老道,完全被忽悠得入神了,原本一个小时的访谈变成三个小时,最后送走用户,一看访谈记录,一片空白。要解决这个问题,需要时刻牢记访谈的目的。如果发现话题不对,就赶紧往正道上扳,若发现多次都扳不过来,就可以考虑尽快结束了,用户很多,不要在一个不合适的对象上花费太多时间。当然,有时候用户侃得十分精彩,如果你不是很忙的话,听听长长见识也可以,这个就自行把握吧。第四,我们过于强势,把用户往沟里带。原来我们团队有一位做销售出身的女生,改行做产品,在新产品中负责了几个模块的设计,设计好了邀请用户来做访谈。她的故事很有趣——开始挺好的,她慢慢深入地问着,用户小心翼翼地答着。随着访谈的进行,用户渐渐地放开了,开始对产品提出自己的看法,于是砖头一块一块的向那位女生的头上抛去,只见她的脸越来越苦,然后终于忍不住了,心说“老娘当年可是做销售的,看我怎么收拾你”……接下来只见风云突转,她给用户晓之以理动之以情,指出了用户的理解有哪些不对的地方,她的产品确实很好,很值得买,几十分钟过去,用户完全被说动(不得不赞叹她的销售功底就是扎实),就差道歉了,觉得这确实是一款好产品,并且承诺说上市以后一定买。用户走后,她心满意足,回来大家一讨论这个过程,都傻了。这个问题的对策,同样是牢记访谈的目的,并且管好自己的嘴。我在看《软件观念革命:交互设计精髓》3的时候,发现里面也讲了不少关于用户访谈的注意点,在本节最后分享给大家。. 避免一组固定的问题:固定的问题会让被访者产生被审问的感觉,我们应该准备好问题清单,但清单只起一个引导作用,并不用照着读。. 首先关注目标,任务其次:比用户行为更重要的是行为背后的原因,多问问用户为什么这么做。. 避免让用户成为设计师:听用户说,但不要照着做,用户的解决方案通常短浅、片面。. 避免讨论技术:特别是碰到一些略懂技术的用户,不要与其纠缠产品的实现方式。. 鼓励讲故事:故事是最好的帮助设计师理解用户的方法。3 本书的作者是交互设计之父 Alan Cooper,附录里有对本书的简单介绍。. 避免诱导性的问题:典型的诱导问题是“如果有××功能,你会使用么?”一般来说用户会给出毫无意义的肯定答复。记一次用户大会用户大会,是邀请产品的用户到某一集中地点开会,人数一般在几十人到几百人不等,可以短时间内从多人处收集大量信息,是一种特别的用户访谈形式。我在 2007年 6 月组织过一次阿里软件网店版的用户交流会。这种会耗费资源较多,一般机会不多,所以要充分利用。按时间分几步重点摘录如下,结合这个提纲,我们来看一下这种用户访谈形式应该如何准备、如何操作,如果把“用户大会”也视为一个产品的话,大家也可以从中看到一些做产品的通用思路:明确目的:会前最重要的是明确这次用户大会的目的和意义,这在争取资源的时候会更有说服力,比如:产品二期卖点确认,辅助运营决策;三期需求收集;现有产品用户体验改进等。资源确定:. 时间:日期、几点、时长。要考虑淘宝卖家的空闲日子和时间段。另外注意要把整个活动各项准备的时间点掐准,留余量。. 地点:场地、宣传用品、IT 设备、礼物、食品饮料、桌椅。. 人物:工作人员:大家一起上,人人有事做,分组分工,注意产品、运营、开发人员的搭配,要有冗余;用户:确定目标用户、数据提取、预约,要充分考虑人数弹性;嘉宾:相关老板、合作部门的同事,不管来不来,邀请要发到。. 材料:用户数据、产品介绍材料(测试环境确保当时可用,静态Demo备用)、可用性测试4材料。. 各项备用方案的准备,用户大会前两天开一次“确认会”。现场执行:. 辅助工作:场地布置(轻松一点,不要像开会);引导/拍照/服务/机动;进场签到(给礼品);全程主持(进度控制);送客/收拾残局。. 主流程:4 可用性测试(Usability Testing)是指在设计过程中被用来改善易用性的一系列方法,下文有详细描述。产品介绍:重点是卖点介绍,与用户互动,观察用户更关注哪些功能,辅助上线前的运营决策,到底主推哪些卖点;抽取部分用户做焦点小组5的讨论,收集后续的需求,产品三期开始启动;同时抽取部分用户做可用性测试,帮助产品二期做最后的微调;最后,合影留念。结束以后:. 资料整理:卖点总结报告、需求收集报告、可用性测试报告。. 运营:本次活动在淘宝论坛发贴;内部邮件。. 整个活动资料的整理归档,包括照片、各项材料/报告信息、用户数据等。5 焦点小组(Focus Group)是由一个经过训练的主持人以一种无结构的自然的形式与一个小组的被调查者交谈,可以视为一种一对多的用户访谈形式。6 种子用户,是指某产品的一些忠诚度很高的用户,产品设计者与他们长期保持交流,让他们试用最新产品,可以经常从他们那里获得产品的建议和意见。7 开放式问题像问答题,不是一两个词就可以回答的;封闭式问题有点像判断题或选择题,回答只需要一两个词。一个三四小时的会,我们好几个人前后忙了有半个月,从计划制定、资源申请、各种材料准备,到当天执行、之后的分析整理……不过这些辛苦都有了回报,在短短几个小时内,从三四十位用户那里获得了很多有价值的信息,比如确定了产品二期主推的 3 个卖点;明确了产品三期优先级最高的几个需求;与这些用户成为朋友,将来可以作为产品的种子用户 6等。这些都为今后的产品发展提供了指导。2.2.2 定量地说:调查问卷同样是听用户怎么说,常见的定量研究方法是——调查问卷。调查问卷和用户访谈的提纲是有区别的:用户访谈的提纲通常是开放式问题 7,适用于我们心里还比较疑惑的时候去寻找产品的方向,适合与较少的访谈对象进行深入的交流;而调查问卷通常封闭式问题比较多,适合大用户量的信息收集,但不够深入,一般只能获得某些明确问题的答案,调查问卷不是考试卷,不适合安排问答题。用户访谈与调查问卷之间也有联系,我们经常通过前者的开放式问题,为后者收集具体的封闭式问题。无论是网上还是线下,作答时间最好不要超过 10 分钟,否则很多人看一眼就被吓跑了。开篇一般放一些简单的不需要思考的问题;很想知道的内容,需要思考的,较敏感的问题一般放在中间;而有关被访者个人信息的题目一般放在问卷的最后,以免应答者在回答这些问题时有所顾忌,进而影响其他答案。调查问卷的常见问题与对策调查问卷一人一份,独立作答,可消除“焦点小组”、“论坛发贴征集需求”等具有群体讨论性质的方法的弊端。这是因为用户有其特点——沉默与骑墙的总是大多数:《长尾理论》里说到“沉默的大多数”,那么站出来的总是很少数,而且往往是非典型的用户,不能保证其代表了目标用户的想法;而“骑墙的大多数”说的是,大多数人是没有明确观点的,尤其在网络这样一个不用负责任的环境下,所以常见的情况就是开始表态的那几个人的观点引导了群体的观点,随机的初始值决定了结果,这个时候你只有单独和跟风者交流,才会发现他根本不是那么想的。调查问卷的客观性、多份问卷之间的独立性,可以有效避免上述问题,但其容易出现的问题在于:第一,样本的偏差,即样本与想了解的目标用户群体出现偏差。之前我们谈到,用户访谈由于样本量的限制,始终只能听到目标用户群体中很少部分用户的声音,而调查问卷可以更多地采样,我们应该充分利用。所以,调查问卷的样本选择,就有几个注意点 8:尽可能覆盖目标群体中各种类型的用户,比如性别、年龄段、行业、收入等,要保证各种类型用户的样本比例接近全体的比例,比如目标用户中男女比例为 7:3,那么我们的样本也应该保持这个比例。但在实际工作中,经常会因为各种原因没法做到样本选择的合理性,比如我们的产品全国销售,但要做街头的拦截调查,出于成本考虑,只能选择特定城市的目标用户;又如利用网络做调查问卷,能在特定时间、特定页面上看到问卷的人,已经是一种筛选;再如在各种场景下,愿意填写问卷的人,也许与目标群体的整体也有不同,又是一种筛选。所以,在类似情况下得出结论的时候,大家最好把这些潜在的筛选条件标明,让报告的读者知道数据获得的方法与来源,同时如果我们是报告的读者,也要一直带着问号去阅读里面的数据。8 更理论化的内容,大家又可以去翻《概率与数理统计》的课本了。还有一个小技巧,就是可以把目标群体的特征也定义成一系列问题,放入问卷中,待我们回收问卷以后,就可以通过这些问题评估作答者是否能代表目标群体了。如果发现了偏差,我们也可以从回收的问卷中再筛选出一个接近目标群体的子集来分析。第二,样本过少的问题。样本量过少时,采用百分比来分析是没有意义的。这是很多新人会犯的错误,比如只问了 5 个人,3 个人选 A,就在报告中说有 60%的用户选 A,这是很不严谨的。因为如果换 5 个人再做一次,很可能就是 40%了,而这样的数字百分比要具备稳定性才有价值。所以,此时只能说“问了 5 个用户,有 3 个用户选 A”。抛开严谨的统计理论不谈,要给出百分比答案的话,至少得有大约 100 份的答案。第三,问卷内容的细节问题。首先,问题表述应无引导性,这点和用户访谈类似。比如,不要问“你喜欢某个产品吗”,这时用户可能会考虑到提问者的情感而回答“是”,正确的问法是“你是否喜欢某个产品?”答案的顺序,可能产生“顺序偏差”或“位置偏差”,即被调查者选择的答案可能与该答案的排列位置有关。有研究表明,对陈述性选项被调查者趋向于选第一个或最后一个答案,特别是第一个答案;而对一组数字,如价格和打分,则趋向于取中间位置。为了减少顺序偏差,可以准备几种形式的问卷,每种形式的问卷选项排列的顺序都不同。因此,对于重要的问卷,为了避免上述问题,还有个通用的办法就是先进行小范围的试答,根据反馈修改后,再大面积投放,这和互联网产品的灰度发布 9有着同样的理念。9 灰度发布是互联网产品发布上线的一种常用形式,先让少量用户看到新产品,利用他们的反馈进行修正,逐步把新产品展现在所有用户眼前。10 问卷地址:m/。设计一份实际的问卷我们来试着设计一份实际的问卷。和做任何产品一样,先想清楚目的,然后明确样本对象、调查渠道、时间计划等,最后才是问卷内容本身。给大家一个实例,我为这本书的读后反馈设计了一份调查问卷,放在个人博客 10上,欢迎大家有兴趣来做一下。问卷目的:收集本书的读者反馈,总结得失,希望以后能做得更好。样本对象:本书读者,扩大到博客读者,以及对产品经理感兴趣的人。调查渠道:网络,个人博客上发布。时间计划:本书上市后放出问卷,收集至少 3 个月后给出一份分析报告。问卷内容:不断优化,你真正看到的可能与下面有区别。同学你好,我是《人人都是产品经理》的作者苏杰,这个问卷是为了……,作答大约需要 2 分钟,完全匿名,非常感谢。首先,是一些简单的问题,帮助我对作答者进行分类。. 你看过《人人都是产品经理》这本书么?单选是,否. 你看过“iamsujie 的产品设计”这个博客么?单选是,否. 你是怎么知道这个问卷的?单选通过书,通过博客,其他网上渠道,其他线下渠道然后,是一些我最想知道的问题。. 你工作多久了?单选还是学生,1 年以内,1 到 2 年,3 到 5 年,6 到 10 年,11 年及以上. 你是几岁的产品经理?单选.1 到 0 岁,1 到 2 岁,3 到 5 岁,6 到 10 岁,11 岁及以上. 你的岗位?单选产品经理,其他产品相关(如需求分析、用户体验、交互设计、运营),商业相关(如市场、销售、服务),技术相关(如开发、测试、架构、运维),各种管理岗位,其他. 你的行业?单选互联网,软件,其他 IT 类,其他. 你的公司规模?单选10 人以下,10 到 100 人,100 到 1000 人,1000 人以上. 你工作中接触最多的主题?多选用户,需求,项目,文档,流程,战略,修养,职场,其他. 你希望我多说些什么主题?多选用户,需求,项目,文档,流程,战略,修养,职场,其他. 你觉得我的优势在于?多选用户,需求,项目,文档,流程,战略,修养,职场,其他. 你觉得我的劣势在于?多选用户,需求,项目,文档,流程,战略,修养,职场,其他接着,想了解一些你的情况。. 你的性别?单选男,女. 你的年龄?单选20 岁以下,20 到 25 岁,26 到 30 岁,31 到 40 岁,41 岁及以上. 你所在的城市?单选北京,上海,杭州,深圳,广州,其他. 你的月收入?选择1k 以下,1k 到 2k,2k 到 4k,4k 到 8k,8k 到 16k,16k 以上最后,还有什么想说的?2.2.3 定性地做:可用性测试可用性测试是指通过让实际用户使用产品或原型方法来发现界面设计中的可用性问题,通常只能做少数几个用户的测试,看他们怎么做,属于典型的定性研究。它是UGC11理念的一种很漂亮的实践,在目的明确的前提下,简单介绍一下主要过程。首先要招募测试用户。招募测试用户的主要原则是,这些用户要能尽可能地代表将来真实的用户,比如说,如果产品的主要用户是新手,那么就应当选择一些对产品不熟悉的用户。然后是准备测试任务,测试的组织者在测试前需要准备好一系列要求用户完成的任务,这些任务应当是一些实际使用中的典型任务。11 UGC:User Generated Content,用户产生内容。UGC 其实并不是新概念,传统行业的宜家(IKEA)早在 50 年前就有所行动,让终端用户参与到产品的设计的各个环节中。接下来的重头戏是测试过程。可用性测试的基本过程就是用户通过使用产品来完成所要求的任务,同时组织者在一旁观察用户操作的全过程,并把发现的问题记录下来。测试结束后:组织者可以询问用户对于产品整体的主观看法或感觉。另外,如果用户在测试的过程中没有完全把思考的过程说出来,此时也可以询问他们当时的想法,询问他们为什么做出那些操作。最后是研究和分析:在可用性测试结束之后,组织者分析记录并产出一份产品的可用性问题列表,并对问题的严重程度进行分级,使得我们可以根据项目进度来选择哪些优先处理。可用性测试的常见问题与对策和用户访谈、调查问卷一样,可用性测试也有其特别需要注意的问题。第一,如果可用性测试做得太晚(往往在产品将要上线的时候),这时发现问题也于事无补了。其实,可用性测试在产品的各个阶段都可以做。在尚无任何成型的产品时,可以拿竞争对手的产品给用户做;在产品只有纸面原型的时候,可以拿着手绘的产品,加上纸笔给用户做;在产品只有页面 Demo 的时候,可以拿 Demo 给用户做;更多的时候,在产品已经可以运行以后,可以拿真实的产品给用户做。不同阶段不同做法,从中都能发现相应的问题。第二,总觉得可用性测试很专业,所以干脆不做。可用性测试,听着很专业,但收益又无法量化,所以对很多老板来说,不太愿意在这个上面投入资源,经常因为项目时间过紧被略过。我们知道,可用性测试通常来说做 5 个左右的用户才可以发现大部分的共性问题,前前后后的准备也耗时不少,但只做一个用户,并且简化步骤,也比不做要好。对一个内部使用的用户管理平台,我自己尝试过一次最轻量级的可用性测试,表现为:一个同事,半个小时,在我的座位上,简单的几个任务,比如“将 XXX 用户的有效期增加一年”,“将 YYY 公司的状态设置为冻结”,“查询 ZZZ 公司的员工数”等。结果发现了十几个问题,效率很高。第三,明确是测试产品,而不是测试用户。可用性测试要邀请用户来做测试人员,我们在开始之前,应当明确地告诉用户,这个测试的目的是发现软件产品中的问题,而不是要测试用户是否有能力来很好地使用软件。所以,不要让用户听到“可用性测试”的术语,而是说“来试用一下我们的新产品,提点意见”。清楚地说明这一点将有助于减轻用户的压力,使得他们能像在真实环境一样来使用软件。第四,测试过程中,组织者该做的和不该做的。刚开始的时候,可以告知用户大概持续的时间,要做哪些事情,让用户心中有数,轻松愉快地完成任务。可用性测试中,我们可以要求用户在使用产品的过程中采用一种名为“发声思维”的方法,即在使用产品的同时说出自己的思考过程,比如为了完成某个任务,用户想先做什么,后做什么,为什么要做某个动作,等等。做测试的过程中千万不要有任何的引导与暗示,而只是观察和记录,因为任何引导都可能使得原本可以发现的问题无法暴露。用户行为和预想的不一样时,可以提问,实在进行不下去的时候,给予提示。记住,一切的错都是产品和我们的错,用户绝对没有错。如果真觉得用户错了,那也是你找错人了,不是这个人错了。结束之后,如有可能应该送个小礼品,当然在邀请的时候就要告诉用户会有一些对他付出时间的补偿。尽快总结,并且发给用户,一方面让用户感到他做了一件有意义的事,另一方面也是表示感谢,建立长期和谐的“用户参与产品设计”的氛围。最重要的,这份总结要用于指导产品改进,这才是可用性测试的根本目的。产品改版的一次冒险每一个优秀的产品(Gmail、豆瓣(m)、开心网(m)也许是),都是靠着不断的升级、优化、改版才逐渐获得认可的。改版的初衷都是为了产品升级,更好地服务用户,但改版在客观上会挑战用户现有的习惯,所以必须慎之又慎。可用性测试就是一种很合适的方法,来保证产品改版的安全性。对于一个产品经理来说,如何在合适的时机推动一次合理的改版,是一大考验,本节回忆 2007 年我发起的一次产品改版——网店版从 1.0 升级到 2.0,当时的可用性测试做得太晚,想想真是后怕。这次改版在页面风格上有极大的变化,如图 2-5、图 2-6 所示,网店版 1.0 的时候,考虑到我们的目标用户全部是淘宝的大卖家,所以沿用了淘宝网“我的淘宝”的页面风格,之后的几个月,随着产品的发展,我们发现在 1.0 的页面框架下,很多功能设计起来都要瞻前顾后,所以决定颠覆性地把导航菜单从左侧移到上方,释放页面空间,并且改变了很多交互、视觉的细节。图 2-5 网店版 1.0 首页示意图图 2-6 网店版 2.0 首页示意图整个过程几乎完全凭借我们的喜好改进,直到上线前几天,才叫了几个用户来做可用性测试,而这时候其实我们已经知道没时间改了,只是想听用户说一声“Yes”来增强自己的信心,如果这时候用户说“No”,绝对是一个灾难。好在参加测试的用户对我们说了“Yes”,上线后数据分析的答案也是“Yes”,我们才没有因为缺乏经验而造成太多损失。在这之后,我再也不敢这么晚才做可用性测试,联想一下淘宝网“我的淘宝”曾经做过的改版、2007 年底豆瓣为了庆祝注册用户过 100 万的改版、2009 年百度贴吧的改版,都因为用户的反对声音太大不得已道歉、改回去,我们真的很幸运。不好的过程,还算 OK 的结果,让我事后去恶补了不少常识,对于改版,除了“可用性测试”要在足够早的时候做以外,发布后也是有一些方法改进的。比如先从部分次级页面改起,像“我的淘宝”历时多年的改版;再如新旧版本并存一段时间,并允许用户自由选择,比如 2007 年的雅虎邮箱和新浪邮箱改版;三如小面积试验,选择一小批测试用户放出新版本,监测效果,做用户调研,比如 Gmail 在发布某些新功能的时候;四如傍上一个用户已经习惯的风格,比如网店版的前身“高级店铺”升级到网店版 1.0 的时候,讨论了很多方案,最终还是决定模仿“我的淘宝”的页面风格。总之,对于改版,对于升级,我们要把“暴力革命”变成温柔和谐的“和平演变”。2.2.4 定量地做:数据分析只要你做的是一个大用户量的产品(互联网产品往往都有这个特点),那么我们总会惴惴不安:上述 3 种方法,就算做问卷的普查,回收到的有效问卷也可能不到用户总数的 10%,或者说,在样本的选择上都有一定的被动性——需要样本同意参与,所以它们都只能接触特定的少部分用户,那么到底能不能代表目标用户群体?虽然绝大多数情况下的经验证明,只要在用户的选择上没犯什么低级错误,他们是“具有代表性的”,或者说接受这种假设是一种性价比很高的廉价解决方案。不过,我们还有数据分析,一种定量的研究方法,数据来说话,看看用户到底是怎么做的,不论是考察目标用户全体、还是采样,都完全可控,所谓“According to the data”是最难被驳倒的。数据分析时,根据不同的目的,数据来源多种多样,常见的有用户使用产品的日志、客户管理系统里的信息、网页访问情况的统计信息等。数据分析的方法,最简单的可以用 Excel,复杂一点的可以用一些统计软件、数据库软件,或者直接自己写程序解决。而最最关键的就是对结果的解读,通常数据分析只能发现一些现象和问题,并不能了解原因,所以分析完成后通常会伴随着一些用户访谈,听听用户怎么解释。数据分析的常见问题与对策我们要意识到,用户“怎么说”和“怎么做”不同,甚至经常有矛盾,有时候用户的行为比语言更能反映出他的真实需求。比如用户说在搜索买家的时候应该加一个“按交易额搜索”的条件,也许只是他某次特殊的需要使然,但如果我们听他的做了这个功能,之后通过用户行为的数据分析发现,只有 1/10000 的人用过,那就表明我们被用户的说法骗了,但数据永远不会骗我们。不过,在数据分析时也会有一些特定的问题,下面让我们逐一分析。