1.1 信息觅食理论的起源与发展
信息觅食理论源自人机交互领域有关智能信息访问的研究,Pirolli在研究中发现,研究参与者面临的问题并不仅仅是收集更多的信息,而是如何优化信息策略以减少信息搜寻的时间,从而获得单位成本的最大收益[5]。为了寻求这类问题的解决方案,Pirolli对行为生态学领域的相关文献进行了深入分析,发现最优觅食理论的要素有助于解释人类对获取和理解信息的适应能力[6],并进一步结合理性分析的方法,以“觅食”一词来代表个体进行信息搜寻的过程,在此基础上形成了信息觅食理论。信息觅食理论的演化大体上可以划分为基础模型、认知模型和行为预测模型三个阶段。
1.1.1 信息觅食理论的基础模型
为了达到特定目标,信息觅食者会做出一系列的信息行为,即在信息斑块内部或之间使用个人信息菜单寻找必要的信息。在这一基础上,Pirolli等人引入了Stephens等人提出的两个模型:斑块模型和菜单模型[7],作为信息觅食理论的基础模型,用以分析不同的信息搜寻策略。
1.斑块模型
斑块模型阐述了觅食者在资源不平均分布的环境中的决策问题,假设自然环境中的食物资源是呈斑块状分布的。而信息觅食理论实现了从动物觅食到信息觅食的跨越,将个体在信息觅食过程中遇到的相关信息也看作是呈斑块状分布的,即信息环境中的觅食者同样会面临着资源的不平均分布及如何觅食资源的问题(见图1-1)。
图1-1 斑块模型
资料来源:PIROLLI P.Information foraging theory: adaptive interaction with information[M].New York: Oxford University Press,2007.
在斑块模型的基础上,Pirolli假设信息觅食活动中觅食者的累积收益为G,并结合在斑块间移动的时间及在斑块内觅食的时间,提出了觅食行为累积收益图(见图1-2),其中,横坐标代表觅食进行的时间,纵坐标代表觅食活动的累积收益,因此,觅食活动的平均收益率R就表示为累积收益G与觅食活动所花费的总时间TB+TW之间的比值:
图1-2 觅食行为累积收益图
资料来源:PIROLLI P.Information foraging theory: adaptive interaction with information[M].New York: Oxford University Press,2007.
2.菜单模型
除了要考量在不同的信息斑块中觅食的时间,个体在信息觅食时还需要考虑应该选择什么样的食物,或者抛弃何种类型的食物。传统的菜单模型有助于解释觅食者在不同的斑块中应该觅食哪些猎物的问题,因此,在传统菜单模型的基础上,Pirolli等人进一步提出了一种最优菜单选择模型[8],用以帮助用户制定更为合理的觅食策略。在最优菜单选择模型中,觅食者可以根据信息平均收益率和信息分布情况判断菜单内是否应该包含该类信息,这种最优菜单的选择方法可用于判断能够达到最大收益率的信息子集。一个最优菜单选择过程如图1-3所示。
图1-3 最优菜单选择过程
资料来源:PIROLLI P.Information foraging theory: adaptive interaction with information[M].New York: Oxford University Press,2007.
1.1.2 信息觅食理论的认知模型
由菜单模型可知,觅食者会对可用的不同行为策略的效用做出判断。在此基础上,Pirolli等人将他们判断时所处理的局部提示定义为信息线索[9],并将这一概念考虑进来,进一步构建了信息觅食理论的认知模型——SNIF-ACT模型[10](见图1-4),旨在通过描述链接、页面布局、用户工作记忆和视觉注意模式的词汇,来反映用户在与网页交互时的链接选择及交互时间和注视模式,模拟用户信息搜寻的整个过程[11]。
在提出SNIF-ACT模型之后,为了测试信息线索对导航选择行为的基本预测能力,并进一步将信息线索的预测能力与链接位置相结合,Pirolli等人又相继提出了SNIF-ACT 1.0和SNIF-ACT 2.0模型[12]。SNIF-ACT 1.0模型继承了初始模型中的冲突解决机制,假设一个页面上的所有链接都是由用户按顺序进行评估并处理的,并使用随机效用模型对某一链接被选中和执行的概率进行计算,结合激活扩散理论来评估信息线索的效用[13]。与SNIF-ACT 1.0不同,SNIF-ACT 2.0模型实现了一种基于经验的机制,进一步将信息线索和链接位置融入模型中,并结合贝叶斯机制进行Web链接的评估,使得该模型能够动态地建立一个期望水平,即按顺序处理网页上每个链接目标信息被找到的可能性,从而帮助用户选择最好的链接,而不用耗尽整个网页上的所有链接。
图1-4 SNIF-ACT模型
资料来源:柯青,王秀峰.Web导航模型综述:信息觅食理论视角[J].现代图书情报技术,2014,30(2):35.
整体而言,SNIF-ACT模型为不同用户在各种任务中的个人-信息交互行为提供了极好的契合,但Fu等人指出,链接的顺序处理假设在某些类型的网页中可能并不适用,且专家用户也可能无法使用当前的模型来满足目标需求[14]。因此,未来SNIF-ACT模型在不同类型的网页或专业领域的应用还有待学者对其做进一步扩展。
1.1.3 反应式信息觅食理论的行为预测模型
作为一个功能完备的认知模型,SNIF-ACT模型多用于描述基于Web的导航行为,且必须针对所研究的每个信息搜寻语境进行定制,因而很难将其应用于新的领域。因此,为了探究基于Web导航行为的信息觅食理论能否用于预测开发人员浏览源代码的导航行为,Lawrance等人提出了PFIS(programmer flow by information scent)模型[15]。
PFIS模型建立在WUFIS(web user flow by information scent)算法的基础上[16],并对WUFIS中使用的Web路径跟踪方法进行了扩展,将信息检索技术与扩散激活机制相结合,旨在计算在给定具体需求的情况下,开发人员从源代码中的一个类或方法到另一个类或方法的特定“链接”的概率。然而,Lawrance等人指出,尽管PFIS模型对导航行为良好的预测效果通过实证研究得到了证实,但由于该模型假设源代码不变,且需要预先描述信息觅食的目标才能做出预测,在开发人员的目标及源代码发生变化的研究中,PFIS模型可能未必适合对用户的行为建模[17]。
因此,考虑到开发人员在其任务中通常会发生的目标演变,Lawrance等人提出了一种反应式信息觅食理论,并将PFIS模型扩展为PFIS-Ⅱ模型,用于预测开发人员的动态导航行为。与SNIF-ACT模型不同,PFIS-Ⅱ模型既不需要认知建模,也不需要估计语义相关性。相反,PFIS-Ⅱ将信息空间视为源代码拓扑结构和开发人员所获线索这两者的结合,即使没有明确的觅食目标,只须使用用户公开的导航行为和信息环境,就能够成功预测开发人员日常活动中的导航行为。
为了探究多因素模型能否提升预测导航行为的准确性,Piorkowski等人将PFIS-Ⅱ模型进一步细化为PFIS-Ⅲ模型[18]。PFIS-Ⅲ模型使用数据模型来预测开发人员的斑块间导航行为,根据开发人员的当前位置用初始权重激活一些斑块,然后结合源代码提示、开发人员的导航历史及信息空间的拓扑结构将此激活扩展到其他斑块,并根据结果权重对斑块排序,最后返回排名最低的斑块作为其预测结果。与单因素模型相比,PFIS-Ⅲ模型的这一扩散激活机制有助于在一定程度上提升预测的准确性。在PFIS-Ⅲ模型的基础上,为了进一步探究在可变信息空间中开发人员的导航行为,Ragavan等人提出了PFIS-Ⅴ模型,旨在用数据模型来表示多个信息空间的变体,对开发人员在可变信息空间中的心理模型和觅食行为做出不同假设。研究结果表明,PFIS-Ⅴ的预测准确率要比PFIS-Ⅲ高出25%左右[19]。
由此可见,随着信息觅食理论的不断发展,在未来的研究中可能会建立更为精确的模型以预测信息觅食行为,并进一步验证将反应式信息觅食理论应用于其他类型的信息行为的可能性。此外,虽然已有学者将PFIS-Ⅲ模型用于解决推荐工具中的结构不良问题[20],但其研究中包含的线索类型有限,因此,如何将PFIS模型的准确性发展为有效的工具也是未来值得关注的研究方向。