游戏性
在游戏业,没有比游戏性(gamepiay)更重要、更混乱、更容易引起争议的名词了。人民普遍认为游戏性是游戏的最重要的属性,是决定游戏成功的关键。什么是游戏性?游戏性包含哪些要素?则众说纷纭,没有定论。这就出现了一个尴尬的局面――游戏性对游戏的成败怎么重要,但大家又说不清楚游戏性是什么,也没有很好的方法来保证游戏性的成功实现。当然有人会争辩说游戏性就和艺术家的知觉一样,是只可意会而不能言传的。你去问一个著名的画家怎么才能画出不朽的杰作来,或者什么才能称的上是不朽的杰作,他肯定也说不清楚。的确,游戏性和游戏设计在很大程度上决定于直觉和经验。作为工业化协作制造出来的“软件”产品,游戏和游戏性又不能停留在直觉阶段。只有在明确了自身规律之后才能保证其产品质量,可持续地制造出高质量的产品,并保障开发投资获得回报。我们知识短见工程有一个著名的论断:对于软件和软件开发过程的一个属性,如果不能明确定义的话,就不能有效的测量;如果不能测量的话,就无法改进。因此整个软件工程的思想基础就是为软件和软件开发过程定义一个属性,以及测量它们的方法,然后在通过系统化的工作去改进这些属性。同样地,对游戏性来说,如果不能确切定义它,就无法改进它。本次所要探讨的,就是如何定义游戏性,如何从多方面多角度了解它,从而进一步采用更成熟和更正规划的方法去改进游戏性铺路。
可用性
在探讨游戏性的问题之前,我们先从另一个角度介绍一下可用性(usability)的概念。可用性和游戏性是一个孪生兄弟――可用性是商用软件的重要属性,而游戏性则是娱乐软件的重要属性。两者之见有很多共性和千丝万缕的联系。了解了可用性的概念,有助于我们开拓视野,去更好地了解并定义游戏性。
从历史角度看可用性和游戏性
非常幸运的是,可用性的概念的定义和发展走了一条和游戏性完全不同的道路。从历史的角度来看,游戏性这个概念很早就被提出来了。从20世纪80年代中期开始(gameplay)这个词就被造了出来(这个词在英文字典里是没有的,是游戏业自己造出的词)。然后所有的游戏设计师都接受了这个词,并成为业界的标准用语。从那时候起,所以的游戏设计师都同意游戏性是游戏最重要的属性。但是,大家都谈游戏性,却都是泛泛而谈和漫而谈之,没有采用系统的方法去严谨定义,没有理论上的深化,也没有具体的分析。也就是说游戏设计师们对游戏性的认识还是处于很粗浅很原始的阶段,还只是感性经验,没有理性的量化分析。而反观可用性,这个词在商用软件领域,也别是网站方面的流行,是在90年代中期,也就是落后了游戏性10左右时间。但可用性一开始就有强大的理论基础,提出可用性概念的不是业界,而是大学研究机构。可用性的理论基础是综合了计算机科学、设计、心理学和人机交互学(Human-Computer Interaction,缩写为HCI)。在理论的基础上,实际工作者们在软件设计开发过程中,对可用性概念进行更深的分析综合,甚至对某些方面采用了量化分析的方法,从而使得他们对可用性的认识超越了一般的感性经验。更重要的是,通过对可用性的分析,开发出一系列方法、流程、规则和标准来帮助软件设计开发人员去设计更可用更好用的软件。这点需要格外强调:因为分析可用性本身是没有意义的,比事后分析一个已知软件的可用性更重要的基于分析去总结经验和规律,并以此事先指导软件的设计,设计出好用的软件。
所以从历史的角度看,游戏业在游戏性方面的工作虽然起步得很早,但其发展应用则完全落后于可用性。商用软件业在可用性方面的工作对游戏性可以有很大的借鉴意义。
定义―评估―设计
人机交互研究领域和商用软件业在可用性方面的工作基本上可以看成有三个步骤。首先是定义一个概念名义这个概念代表一个软件系统的基项属性。然后根据这个定义去设计一些评估方法,用来评估现有系统的这个属性。最后在评估的基础上,改出一套设计方法、工具、流程,来帮助软件设计人员更好地进行设计工作。定义的目的是为了评估,评估的目的是为了更好地设计。
可用性的定义
首先来看可用性的定义。初看上去,可用性和游戏性最大的共同点就是其模糊性和主观不确定性。什么是可用 ?什么是好用?一个软件,如微软的WODR字处理软件,可以帮助用户完成一定的工作任务。软件开发人员去采访用户的时候,问他们:“这个软件好用吗?”用户们会给出各种回答,“好用!所见既所得(WYSIWYG)的排版功能太棒了!”“不好用!这个标题的字体怎么改不了?”,“太过分了!怎么才能去掉那个讨厌的曲别针?”这些情态各异有时甚至相互矛盾的挥发是用户从个人的角度对一个软件的可用性做出的评估。这些评估是模糊的,因为他们是用户根据自己的体验总结的。人和人之间计算机操作技能不同,年龄不同,眼力不同,必然导致对同一个软件做出不同的结论。
对软件开发人员来说,显然不能满足于从用户那个得到这么多乱七八糟自相矛盾的评估。他们设计软件的目的,不是给一个两个用户使用,而是给成百上千敌人使用。这就带来一个问题:如果软件只能给一两个人用,那很好办,我们去和他们坐在一起,详细地了解他们的需要,他们的脾气秉性,他们的习惯和技能,然后根据这些信息去设计软件。这样设计出来的软件,肯定符合他们的要求,对于这一两个用户来说肯定是“可用”的。但问题是,现代商业软件是给成百上千人用的,他们之间的个体差异太大了,如何设计软件使得他们都满意呢?也就是说,如何设计软件使得软件对于成百上千人都是“可用”和“好用”的呢?如何综合成百上千人的意见,找出其共性,并基于共性去设计软件呢?
另一方面,可用性是一个很复杂的概念。当要户说:“怎么也搞不清楚如何设置文本?”时,他们所遇到的问题和“上次用了数学公式,这次怎么也找不到那个选项了”是不一样的。
通过上面的分析,我们看到可用性是一个很复杂的有极大主观因素的概念。我们再来看HCI研究工作者是如何解决它的定义问题的。
在西方思想库中威力最大的武器之一就是分类法了。在古希腊时就发展出的动植物分类法是西方现代科学的基础。可以说没有分类法就不会发展出进化论。分类法基本思想就是 把纷繁复杂的世界分门别类,分而击之(divide and conquer)。
我们看看分类法是如何在可用性定义上发挥作用的。分类就是首先承认这个概念十分复杂,不能简单地定义或者简单地分析,必须把它分成各方面,从各角度来分析。当用户拿到一个新的软件时,他要开打包装,安装然后使用。由于是第一次接触这个软件,必须有一个学的过程。可学习性(learnability)的概念就被分离出来了,作为可用性的第一个子概念。当学习期结束,用户完全掌握了软件的主要功能的使用后,他必须使用软件完成日常的事务性操作。在进行日常事务性操作的时候,由于用户已经对软件的主要功能烂熟于心,他基本是靠条件反射,非常迅速地完成一系列操作。也就是说,理解和记忆位于视觉匹配和肌肉反应。这样效率(efficiency)的概念就被提出来了。效率的概念是针对一个软件的主要功能的。除了那些用户每天都在使用的主要功能外,一个软件还有其他并不常用的辅助功能。这些辅助功能可能一个月被用一次(比如月度统计功能),也可能一年才被用一次(比如被黑客攻击后的数据恢复功能)。这就带来了另一个问题,当这个月费九牛二虎之力把这个冷僻的功能学会后,过几个月再用时,还记得起来如何使用吗?可记忆性(memorability)的概念又被提出来了。
所以我们看到,通过分类法,我们已经把可用性分离成了三个子概念。每个子概念都比较清楚,相互之间界限比较明确。我们可以针对不同子概念,进行深入一步的工作了。
在完成了分类法后,第二项工作就是把可用性的主观因素和客观因素分离,模糊的部分和确定的部分分离。这也是西方思想界的传统――科学有科学的领域,宗教有宗教的领域。科学解决不了的东西,属于上帝。理性于神性分开。这么做对科学的发展同样是非常重要的。可用性来说,就是要分清楚哪些部分是客观的,是共性的,是能够精确分析的;哪些部分是主观的,因人而异,模糊的,无法使用精确的量化分析处理的。
我们发现前面介绍的三个子概念――可学习性、效率、可记忆性,都是共性大于个性(如果学习没有共性的话,学校也就不可能存在了),客观大于主观。也就是说,它们都属于客观因素/经过这样分析后的可用性的定义,是一个多维的概念,即有主观的因素,又有客观的因素,同时含有多个子概念。
可用性的评估
在可用性定义的基础上,我们可开始进行评估工作。
首先看看客观部分。既然我们已经分离出一些子概念了,那么可以对各个子概念对症下药,设计出各种评估方法来测量之。请看列表,列出了评估可学习性和效率的部分方法。这些方法是基于认知科学(Congnitive)和心理学研究的成果发展出来的。有的是定量分析方法,有的是定性分析方法。
子概念 评估方法
可学习性 CW(Cognitive Walkthrough)方法(定性分析)
效率 Model Human Processor(定量分析)
Fitt’s Law(定量分析)
GOMS模型(定量分析)
为什么我们可以针对客观部分的子概念设计出这些评估方法呢?因为客观部分的子概念共性大于特性,是确定的而非模糊的。而心理学和认知科学的研究就是基于人类共性的,所以其基本理论和思想可以被HCI研究工作者用来测量这些子概念。
对于主观的部分,由于其模糊性,其特性大于共性,无法采用前述各种评估方法,必须采用实证和考察来评估。做个比喻:比如说一部电影,在使用了包括编剧、镜头、剪辑等通用的电影技术后,最后观众是否喜欢。还是得等他