王秀云
(济南大学图书馆,山东 济南 250022)
【摘 要】大数据时代,图书馆服务质量的提高需要大数据的支持。图书馆可通过增加大数据分析服务、与社交网络融合、培养面对大数据时代的分析能力来创新图书馆的服务。
教育期刊网 http://www.jyqkw.com
关键词 图书馆;大数据;数据分析;图书馆服务
作者简介:王秀云(1972.03—),女,1999年毕业于东北大学,济南大学图书馆电子阅览部,馆员。
随着信息技术的发展,用户通过网络、手机、客户端等多种手段无时无刻地在向世界各地接收和发送数据,带来了各种数据海量般快速产生,人类已进入了一个大数据的时代,大数据的概念应运而生。2011年5月,全球知名咨询公司麦肯锡发布了一份题为《大数据:创新、竞争和生产力的下一个前沿领域》的报告,报告指出“数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来”[1]。目前,大数据已引起各行各业的高度重视,并作为战略性技术大力推动其发展。EMC、IBM、惠普、微软、Oracle在内的IT巨头纷纷通过收购大数据相关厂商来实现技术整合。作为拥有大量数据的图书馆,不可避免的面临着大数据信息浪潮的冲击,如何使用好大数据,更好地服务于图书馆事业发展和读者将成为摆在图书馆面前的重要发展课题。
1 大数据的内涵和影响
大数据(Bia data)是指在一定时间内用常规软件工具对其内容进行获取、储存、管理和分析的大容量数据[2],大数据的特点可以总结为4V:一是数据量大(Volume)。数据量级已从TB发展至PB,甚至开始以EB和ZB来计数。IDC研究报告称,2011年全球被创建和被复制的数据总量为1.8ZB,预计全球数据量大约每两年翻一番,到2020年全球将拥有35ZB的数据量[3]。二是数据类型复杂(Variety)。数据类型涵盖字符数据、文本数据、图片、视频等信息。三是处理速度快(Velocity)。大数据不仅包括结构化、半结构化和非结构化数据,而且这些数据往往是高速实时数据流,大量数据都是随机动态产生,数据处理需要在几秒钟内形成答案。四是价值高(Value)。大数据蕴含着巨大的财富,通过对这些数据进行处理和分析后,可以获得许多有价值的知识、模式用于新的知识服务方式。
大数据为政府、企业以及个人带来了巨大的价值和影响。第一,大数据的开放将提升社会的公开透明度和政府政策制定的效率。一方面,多种类型数据的公开打开了政府部门间和层级间、政府与民众间的边界,政府内部协同办公效率和为民众办事效率大大提高。另一方面,政府通过为大众提供的门户网站、移动政务、政府微博平台与公众在线交流互动,充分汲取民众的信息、知识和智慧,及时调整决策,从而有效提升社会效率和政府效率。第二,随着物联网、移动互联网、社交网络的快速发展,及视频监控、智能终端等的快速普及,使得对消费者个体和群体的行为、态度以及对于信息的反应进行实时观察和了解逐渐成为可能,这为精准定位目标客户群体数据和了解个体消费习惯、风险收益偏好等提供了重要的工具。大数据已被广泛应用于诸多领域并产生出惊人的威力和创新能力。第三,大数据意味着大资源,无论是商业、企业、经济或者其他领域,任何决策行为将日益基于数据分析做出,经验和直觉的判断将不再流行。新数据的不断增长和人们数据处理能力的不断提高,使得利用大数据来进行预测和决策的能力将会随之无限放大。第四,个人成为大数据链条中不可缺少的一环,大量的数据开始应用于人类的生活和工作领域。
2 大数据带给图书馆的影响
2.1 提供了全新的沟通渠道和营销手段
一方面,新型媒体的兴起给图书馆提供了全新的与读者接触的渠道。目前越来越多的图书馆已开通了微博,并将其作为信息发布、信息收集、参考咨询、馆员读者互动的交流平台。通过与微博上读者的交流,图书馆信息服务时效性、互动性得以大大提升,同时也提高了图书馆的形象和知名度。利用社交媒体的力量,往往能够取得意想不到的效果。2012年春运期间,新疆维吾尔自治区图书馆、陕西省图书馆、重庆图书馆和上海市青浦区图书馆先后在新浪网发出了内容相似的微博:“春运期间,图书馆将免费为没有上网条件的外来务工人员提供上网设备,并配有专门的工作人员免费辅导、帮助外来务工人员完成网上订票”[4]。此事经媒体报道后,一时之间图书馆成为社会的热点话题,受到了公众的好评,这对图书馆的形象具有极大的正面宣传效应。另一方面,通过整合并分析图书馆内部和外部数据可以及时、准确获取更为完整的读者信息,从而进行更为精准的信息营销和服务。图书馆本身拥有读者的大量数据,如读者个人身份、借阅记录、信息行为、搜索方式等等,通过对数据的分析可以了解读者信息获取习惯、业务需求、知识应用能力及希望提供什么样的服务等,进而有针对性地根据不同读者特征打造人性化、精确化的信息营销服务,将优质产品及时、准确地送到目标群体手中。
2.2 利用数据的能力将成为图书馆竞争的关键
图书馆界利用数据来提升竞争能力具有得天独厚的条件。首先,图书馆的数据种类繁多,既有所藏文献资源中的纸质纯印本、数字资源、数据库资源、网络资源等结构化数据,也有目前图书馆还无法进行或暂时没有建设的读者信息、服务信息等半结构化和非结构化数据。其次,在信息时代,图书馆在以读者满意度评价模型和服务营销模型为代表的数据分析上积累了大量的实战经验,具备向大数据分析跨越的基础。第三,通过无线移动网络、互联网、多媒体等科技手段,图书馆完全可以通过虚拟的渠道向读者提供浏览、信息查询和获取资源的服务。应该说,图书馆对于传统的结构化数据的利用是处于领先水平的,但一方面图书馆传统的数据库信息量并不丰富和完整,另一方面对于多种异构数据的分析是难以处理的。因此,利用大数据从读者服务环节中发现新知识,创造新价值将成为图书馆竞争的一大关键因素。
3 大数据时代图书馆的服务
3.1 图书馆服务融入社交网络
图书馆要打破传统数据源的边界,应重视新型数据来源,通过各种渠道获取尽可能多的读者行为、意愿、专业需求等数据,并对这些数据进行实时分析,从而挖掘出更大价值。一是注重新媒体读者服务的发展,利用QQ/MSN、博客、论坛、微博这些便捷的多向交流工具开展新书通告、参考咨询、信息推送、活动播报等,吸引读者的关注,实现多种媒介的联动效应,并将其打造成为与到馆服务并行的重要服务渠道。二是将图书馆内部数据和外部社交数据互联,获得完整的读者基本信息表,从而进行更加规范、高效的读者关系管理。三是创造性利用社交网络数据和移动数据进行服务创新和精准营销。如当图书馆通过读者的移动定位信息知道该读者所处的地理位置,便自动发送与其位置相关的各类信息服务;购买新数据库时在网络上征求读者意见,激发读者参与的热情,在了解读者需求、建议的同时达到良好的宣传效果。
社交网络为图书馆提供了一个机会,一个交流平台,但图书馆服务融入社交网络获取更多的读者信息行为存在着一定的困难,需要一个不断探索的过程。首先,图书馆难以得知读者在社交网络上的用户名,也就难以进行数据处理、整合分析。图书馆可举办各类互动活动来收集读者的用户名,或者在读者协会申请表上添加社交网络用户名的选项,也可以考虑和社交网站进行直接的合作,在实名制的社交网站上,利用已有的读者身份与读者对接。其次,目前尚缺乏成熟有效的非结构化数据的处理技术和工具。在初创时期可采取半人工的方式进行处理。第三,目前在国内图书馆庞大的读者群体中,应用社交网络所提供的服务只是一部分,是青年读者喜爱的网络平台,他们借助这个平台获取信息的需求与他们在成长发展过程中获取知识,寻求友谊、舒缓心情等方面的精神追求和心理需求有关。如果只凭借对他们的分析来制定针对所有读者的策略,统计数据的偏差可能会导致策略的失效,因此暂时只能用于制定一定量的读者群。第四,数据让我们面向更开放式共享和分散式合作的同时,也面临着个人被放在显微镜下观察的困境。知晓读者的信息而又严控其传播范围,坚定地维护读者的个体安全及隐私是大数据时代图书馆员为读者守秘的义务和责任。
3.2 培养面对大数据时代的分析能力
大数据时代,图书馆行业间的竞争不仅仅依靠丰富的馆藏资源、数据共享、创新方式,大数据的拥有量及对各类数据的融合、挖掘与分析能力将成为大数据时代图书馆竞争的关键,图书馆建设方案调整将依赖于对大数据的分析与预测。大数据时代的数据分析与传统的图书馆智能有很大区别。首先,传统的图书馆智能所处理的数据大多是读者身份、借阅记录等结构化数据,是一种对现有资源的分析与挖掘,而在大数据时代,更多需要处理的是读者信息行为、搜索方式、服务消费痕迹等半结构化、非结构化数据。其次,大数据时代的数据容量通常以数百TB或者数百PB来计量,海量的数据超越了人们数据处理能力的范畴,传统的数据分析技术难以有效挖掘这些数据潜在的价值。第三,随着时间的流逝,数据中所蕴含的知识价值往往也在衰减,因此更多的数据分析从离线转向了在线,开始出现实时或准实时处理。这些本质上的区别要求图书馆提供高通量计算机、高可靠性、高可扩展性、高可用性的规模、语义、统计及预测性等数据分析技术、新的数据表示方法[5]。
教育期刊网 http://www.jyqkw.com
参考文献
[1]大数据有大价值[EB/OL].[2012-07-18].http://www. vsharing.com/k/2012-7/662557.html.
[2]大数据时代的企业数据管理 [EB/OL].[2012-12-10].http://www.ebusinessreview.cn/articledetail-195747.html.
[3]IDC研究报告:2011年全球数据总量1.8ZB [EB/OL].[2011-06-29] .http://storage.chinabyte.com/163/12110163.shtml.
[4]新疆维吾尔自治区图书馆的工作人员正帮助农民工网购火车票[EB/OL].[2012-01-20].http://www.xjlib.org/41ba12df-084c-4d8e-8797-cbe458979590_1.html.
[5]詹剑辉.高通量计算机的性能评价[J].中国计算学会通讯,2011,7(7):40-43.
[责任编辑:汤静]