他山之石

基于大数据的自助图书馆服务升级探讨
添加时间:2016-12-23

       摘要 迈入大数据时代,图书馆面临的挑战,也面临的机遇。图书馆应该思考如何借大数据来优化相关服务,以满足用户日益增长的需求。文章以大数据助力自助图书馆服务升级为主题,以深圳市城市街区24小时自助图书馆为例,探讨如何利用图书馆大数据改进自助图书馆服务,主要包括用户管理、读者决策采购、布点优化、物流配送、个性化服务等。同时提出在大数据使用过程中应注意的几点问题,即挖掘数据深层涵义、正视大数据功能、保护用户隐私以及捍卫阅读自由。

   关键词 大数据  自助图书馆  个性化服务

 

大数据研究炙手可热

    随着云计算、物联网、以及社交网络等技术的发展,数据正以无法比拟的速度在增长,这些数据被赋予一个新的名称"大数据"。自2009年以来,国内外兴起关于大数据的研究热潮,各行各业开始思索如何将这些蛰伏的数据"唤醒",比如谷歌就曾利用用户数据发布了谷歌流感趋势(Google Flu Trends,GFT)。这一股风也刮至国内图书馆界,一时间涌现大量关于"大数据"的研究与论著,主题涉及为大数据的内涵、特征、应用范围等基础理论,大数据为图书馆带来的机遇与挑战,大数据与图书馆服务方式的创新,图书馆应用大数据的策略等[[1]]

    实践上,哈佛大学图书馆已经将大数据引入服务,并准备将图书大数据公之于众,另 OverDrive 图书公司将该公司长期以来同各类图书馆合作中获得的电子书和数字有声书的流通状况、读者的图书需求状况、图书馆网站访问的拥堵状况和人口统计学等信息,提供给合作者开放存取以便从海量数据中分析特定的需求众[[2]]。中国国家图书馆正在进行面向全面数字化的一期维修改造,致力于打造大数据时代的数字图书馆[[3]]。此外,2013年初,上海图书馆通过大数据分析了每位读者的电子阅读账单,同时还形成了当年的读者阅读报告[[4]];武汉图书馆也在2014年的世界读书日活动中推出了"我的书单":一季度阅读情况报告[[5]];深圳图书馆也在2015年12月推出"2015﹒深圳市‘图书馆之城'大数据(2014年10月-2015年9月)"[[6]]。可见,国内公共图书馆已经意识到并着手挖掘利用大数据,以便提升图书馆相关图书馆服务。

图书馆大数据没那么乐观

    互联网、物联网、云计算以及大量社交平台技术的衍生,产生了大量的结构化、半结构化、非结构化的数据,关于这些数据笔者认为都可纳入大数据的范畴。"大数据"本质上泛指所有的"数字化内容",而且今天或者未来的"大数据技术"已经能够或者将要可以把所有的"数字化内容"转化为"数据化内容"[[7]],其数据化的内容才是大数据的切实含义。所谓正视大数据,即是我们需要认识到大数据之用途,也需要以冷静的态度评估现实情况中大数据之情境,不可盲目激进、期望膨胀。不可否认,图书馆拥有大量的可用的数据,包括图书馆管理系统应用以来的系统数据、读者的网络浏览检索数据,以及读者在相关社交平台留下的痕迹等,这些数据都隐藏着利用价值,其数据背后的内容是图书馆提供个性化知识服务的重要依据,但真正实现基于大数据的知识服务却仍待时间验证。因为"大数据"并非是"万能"的,而且从技术的角度看"大数据技术群"中还有不少短板,还有不少技术尚未真正成熟,更重要的是"大数据"可能带来的一些信息安全新问题、个人隐私问题等尚未有完美的应对之策。因此,我们既要防止过高估计大数据的现实短期影响力,也要防止低估其未来长期影响力[8]。虽然在人文、技术还是资源方面,大数据利用还存在不少瓶颈,但是这也并不代表我们不可以通过大数据来做一些服务升级。

3   用大数据提升自助图书馆服务

    大数据背景下,自助图书馆如何实现服务升级?主要思路是可以通过整理、分析、挖掘和利用用户大数据,从用户管理、自助图书馆布点,图书采购,物流配送以及个性化服务等方面进行思考,借力大数据,实现优化。

3.1 大数据之于自助用户管理

    用户数据是图书馆大数据的重要组成部分,也是图书馆进行用户分成与细化的主要信息源。用户细分的目的是为了更好地锁定自助图书馆的用户,升级到针对性服务阶段。正如姜山、王刚在《大数据对图书馆的启示》中所言:在大数据环境下,用户生成的数据内容体现了用户的行为特征,针对不同用户的特点和需求,开发具有较强灵活性和适应性的个性化信息服务系统,为用户提供不同的服务方式、服务内容和客户端工具分析用户的信息搜索行为,并且对搜索任务进行研究和总结,建立搜索模型,用来指导用户对资源的查找,以恰当的方式引导用户需求,注重用户的需求研究,建立用户互动体系,培养用户的综合信息素养,并且引入客户关系管理,通过服务跟踪和管理用户,最大限度地为用户提供有效的支持和帮助[9]。用户管理中重要的一部分是用户档案的建立,通过采集自助图书馆用户预借信息、自助点地理信息、以及阅读爱好等信息,开展用户特征分析,进行服务细化,改进用户体验,提高服务质量。以大数据为基础的用户管理,能够进一步的明晰自助图书馆服务对象,进行用户分层,预测读者阅读群体数量、所需的服务资源以及阅读偏好。

3.2 大数据之于资源采购

    目前自助图书馆进行配送的图书分为预借图书以及自助图书馆图书,该两部分纳入全馆采购计划中,后由典藏部门进行分配。在进行图书采购与分配中参考自助图书馆借阅大数据,在一定程度上实现读者需求采购。读者需求采购(Patron Driven Acquisitions,简称 PDA),是指图书馆基于读者的实际浏览与阅读情况,以达到一定的标准或参数而自动触发对某一文献购买指令的资源建设模式,与传统文献采购流程相比较,该模式使读者从文献资源建设的接受者和终端转变为发起者与首端成为文献资源建设的决策者,充分体现了尊重读者以读者为中心为读者服务理念[10]。自助图书馆自使用以来,已经积累了大量的书目数据、读者检索数据、借阅数据等,通过分析这些数据至少可以把握理解本馆读者的部分传统阅读需求,以指导采访与分配工作。同时,通过数据揭示的用户年龄、职业特征因素等,预测用户的阅读数量和阅读需求的变化,制定兼顾多面、满足大众阅读并兼顾小众需求的图书采购计划。

3.3 大数据之于自助图书馆布点

    目前全市各街区布点自助图书馆225台[11],各布点的确定是需要经过进行实地考察,核实人流、交通、遮阳防雨、网络、电力等问题,组织专家进行评审,结合全市的建设规划,按照自助图书馆的布点原则,确定各服务点的布点位置[12]。一台自助图书馆的设立不论是在前期现场布置、设备购买,还是后期的维护与运行,对人力和财力都有一定的要求,因此布点的选择需要尽可能实现该设备的效益最大化,使区域范围内可辐射的读者最大化。如何借助大数据来优化和确认布点?一是通过分析用户的地理信息数据以及借阅量数据,确认某片区是否有必要新设自助图书馆点;二是,通过分析自助图书馆借阅量的份额比例,考虑是否变更布点位置或者增加自助设备数量;三是,通过目前自助图书馆电话服务平台,采集读者意见,作为优化布点以及设备更换换代的依据。借助大数据,通过合理化的自助图书馆布点,建立完善的"图书馆之城"网络体系。

3.4 大数据之于物流配送

    用户阅读特征在一定程度上影响了用户图书的选择,自助图书馆的服务人群对文献的需求特性是多样化的、个性化的,同时也是个性化与普遍性兼具的,如何通过科学化地物流调配来尽量满足用户需求,是图书馆需要思考的一个课题。通过大数据分析,挖掘读者借阅特点,洞察读者阅读兴趣,实现按点制定针对性配书计划,包括配送不同占比的图书类别以及制定合理化的图书配送及更新频率,实现"每个读者有其书,节省读者时间"。主要思路是以自助图书馆的借阅数据、读者借阅数据、预借数据以及地理数据为基础,提炼总结该自助图书馆服务读者的阅读需求,对配送图书进行主题内容和数量的调整。例如位于南山腾讯大厦大堂(不对外)的61号自助机,因为该自助图书馆主要是服务于该企业员工,考虑到企业特点,则可相对应加大计算机类(TP自动化技术、计算机技术)图书配送;又再如位于南山西丽小学(小学门口)的131号自助机,则可偏重少儿图书配送,可方便接送孩子的家长甄选利于学龄儿童阅读的图书。

3.5 大数据之于自助图书馆个性化服务

    个性化服务这一图书馆核心标榜语,不论是新技术来袭,或是新理念灌顶,其都会被赋予新的内涵。图书馆用户个性化服务有3个方面的含义:①时空服务的个性化,在用户指定的时间和指定的地点得到服务;②服务方式的个性化,根据用户的个人爱好或特点的要求来开展服务;③服务内容的个性化,所提供的服务不再是千篇一律,而是各取所需,各得其所[13]。大数据应用在自助图书馆服务上,可以实现在指定时间以及指定地点为用户实现的个性化服务。首先分析借阅以及地理位置大数据,针对性的为用户配送契合其需求的图书,并通过短信或者社交平台通知读者到架新书,实现在固定的自助设备上提供针对性的服务;其次,实时地理位置服务,如根据手机等移动终端反馈的位置信息,设置"您附近的图书馆"检索,提醒读者就近自助图书馆地理位置信息,引导读者阅读行为的产生;其三,依据检索及借阅数据,在自助终端、OPAC端、及微信等平台设置"您可能会喜欢"的标签或书目推荐,缩短检索耗时。

4 大数据使用过程中需注意的几点问题

    大数据内在的关联和潜在的价值将为图书馆服务升级提供良好的契机,但同时也存在诸多需要考虑的问题,包括数据分析技术、数据误差、用户隐私及阅读自由等问题。

4.1 远不止数据那么简单

    在当前的网络环境下,信息共享、交流互动已经不再是最迫切的需求,数据的分析和整合才是最大的挑战[14]。大数据真正的价值在于其数据化的内容,数据深处隐藏的才是用户的兴趣爱好。大数据分析首先需要经过大量数据捕获、组织、分析和决策,不仅需要知道读者需求是什么,更要明白读者需求为什么。用户行为分析将不仅关注用户信息行为习惯本身,还会系统关注与用户信息行为有关的整体行为方式,并从中寻找影响他们图书馆利用行为的相关因素,通过对用户日常的自发行为本身的分析更真实地反映用户的信息需求偏好以及行为模式[15];其次,大数据环境下的数据类型繁多结构复杂联系松散,数据分析的第一件事是要为这些缺少联系的数据建立紧密的关联关系,为进一步分析利用提供关联基础。最后,通过关联数据的价值体现,通过寻找数据之间、数据与其他事物的关联关系发现事物发展的规律和预测趋势,即挖掘数据知识,改善服务与支持决策。

4.2 不可尽信大数据

    就如墨菲定律而言,会出错的事情总会出错,当然数据也会出错。正如谷歌流感趋势(Google Flu Trends,GFT),谷歌公司宣称,自2008年以来,公司能够利用与流感相关的网页搜索次数,预测出流感的爆发,这些预测要比来自疾控中心的数据早上好几周。可是,GFT最终还是失败了,而且失败得彻彻底底:相比于2013年实际的流感趋势,GFT的预测偏差高达140%。当谷歌黯然关闭GFT的时候,这个项目已经从"大数据运用的典范"变成了"大数据的缺陷的典范"[16],大数据中有大量的小数据问题。这些问题不会随着数据量的增大而消失,它们只会更加突出[17]。"大数据已经到来,但它并改变不了原有的真理,只是在比以前大得多的数据规模下去解决新的问题、获取新的答案。移植到图书馆,只是用户数据的海量增长,在处理这些数据时,需要发现大数据中的小问题,保持小心求证,降低分析误差,抓住数据映射出的用户真实需求。

4.3 用户隐私不容忽视

    分析读者的阅读需求,图书馆可通过对后台数据的监控与采集,获取读者的个体特征、历史行为、兴趣爱好、社会关系和家庭地址等隐私数据;其次图书馆可利用大数据平台对用户数据进行二次挖掘和发现权,可是这一过程在用户不知情不允诺的状态下无疑存在侵犯用户隐私的嫌疑。在大数据利用过程中,用户隐私问题是业界普遍担忧的一个问题。一旦发生用户个人数据泄露,则会引发读者对图书馆信任危机的产生,图书馆的信誉将遭受损伤,也将面临相关法律责任的判定。因此,在大数据时代,用户隐私数据的利用需要做明确的范畴界定,制定使用准则,以及相关责任的核定,这不仅能够保护用户权益,避免遭到商业化或非法利用,给用户带来损失;同时也为图书馆大数据的利用降低了风险。因此,在这个过程中,需保障读者有知情权,可以控制自己的数据以何种目的被采集,解除读者对于个人隐私的顾虑,让图书馆能够合法合理地采集到更多的读者数据为大数据分析提供保证。

4.4 别让大数据干扰阅读自由

    笔者认为阅读自由是图书馆普遍均等服务的核心要素之一,如果自由选择都受到干扰,何来均等一说?利用大数据的初衷是揭示读者阅读需求,将个性化的图书馆服务送至读者身边,但这一过程中需要界定一个准则,则别让大数据干扰阅读自由。在"数据为王"时代,在各行各业标榜数据至上的聒噪中,图书馆需要明确自身定位,正是大数据所带来的机遇与挑战,避免在数据中顾此失彼。大数据利用是为了抓住用户需求,迎合用户爱好,而并非是要本末倒置,将"读者至上"误解为 "数据至上",因此切不可被大数据"操控","绑架"用户。阅读本也是一件随性化较强的行为,同时读者的阅读特征会随着时间、爱好以及其他因素的影响发生转变,如果在采购、配送以及信息推送流程中刻板地唯大数据分析结果为准,则有可能产生背道而驰的效果,偏离图书馆的服务宗旨,弄巧成拙。

结语

    新理念、新技术的冲击不断鞭策着行业的发展,图书馆在大数据的潮流中要不实现蜕变升级,要不固步自封而被时代摒弃。图书馆迎接大数据时代,机遇与挑战并存,应在理性的步伐中前行,根据实际情况,不过于保守盲目、也不过于激进,利用可用的大数据,从小处出发,改善与提升图书馆服务。图书馆走进"大数据时代"不可躲避的。


[参考文献]

[1]陆静. 我国图书馆界大数据研究评述与展望[J]. 图书馆杂志,2014(1):20-25

[2]杨海亚. 提供公共智慧服务:大数据时代图书馆服务模式创新[J]. 新世纪图书馆,2014(3):10-14

[3]张新娜. 大数据时代智慧图书馆建设路径分析[J]. 图书馆研究,2014(1):9-13

[4]张驰.《上海市公共图书馆2013阅读报告》,盘点申城一年多额阅读情况[EB/OL].[2013-5-11] .http://www.mcprc.gov.cn/whzx/qgwhxxlb/shanghai/201305/t20130531_414778.html

[5]武汉图书馆."i阅读,爱武汉"--2014年武汉图书馆喜迎4.23世界读书日活动安排[EB/OL].[2014-01-31].http://www.whlib.gov.cn/webs/show/notice/82/2081.html

[6]图书馆大数据:年人均借书17册,深圳人都爱看些啥?[EB/OL].[2015-10-30].http://www.sznews.com/news/content/2015-10/30/content_12420190.html

[7][8]陈超. 图书馆如何迎接大数据时代?[J]. 图书馆杂志,2014(1):4-7

[9][14]张斌,马费成.大数据环境下数字信息资源服务创新[J].情报理论与实践,2014(6):28-33

[10]李建伟. 论图书馆大数据在读者决策采购中的应用[J].情报探索,2014(6):76-79

[11]城市街区自助图书馆服务点查询[EB/OL].[2015-12-14].http://www.szlib.org.cn/libraryNetwork/selfLib/id-5.html

[12]城市街区自助图书馆布点征集[EB/OL][2015-12-14].http://www.szlib.org.cn/libraryNetwork/solicitation/apply-desc.html

[13]周青.试论图书馆个性化服务与未来展望[J] .图书馆, 2004(1):73-75

[15]彭兰."大数据"时代:新闻业面临的新震荡[J].编辑之友,2013(1):6-10

[16]大数据傲慢|我们能从谷歌流感趋势预测的失败中学到什么?[EB/OL].[2015-10-21].http://www.199it.com/archives/396471.html

[17] Tim Harford. Big Data:are we make a big mistake?[EB/OL].[2014-03-28]. http://www.ft.com/intl/cms/s/2/21a6e7d8-b479-11e3-a09a-00144feabdc0.html

[作者简介]欧志英,女,深圳图书馆馆员。

(文章来源:《公共图书馆》,http://www.publiclib.org.cn/library/periodical_show/1881.html)