浅谈公共图书馆读者数据挖掘与阅读推广

(整期优先)网络出版时间:2018-07-17
/ 3

浅谈公共图书馆读者数据挖掘与阅读推广

杨赟

深圳市宝安区图书馆广东深圳518000

摘要:信息技术的发展既让读者对公共图书馆的阅读推广活动提出了更精确、更个性的新要求,也同时为公共图书馆提供了解决方法——利用数据挖掘技术,对读者的描述型数据和行为型数据进行深入分析,预测读者需求偏好,对读者进行群体细分,并据此形成读者需求模型,针对不同细分群体读者的不同需求模型,开展合适的阅读推广,满足读者的新要求。

关键词:公共图书馆读者数据挖掘分析阅读推广

中国新闻出版研究院发布的第十四次全国国民阅读调查报告显示,2016年我国国民人均图书阅读量为7.86本,较2015年增加了0.02本。人均微信阅读时长为26.00分钟/天,较2015年增加了3.37分钟。数字化阅读的发展,提升了国民综合阅读率和数字化阅读方式接触率,整体阅读人群持续增加,但也带来了图书阅读率增长放缓的新趋势[第十四次全国国民阅读调查报告出炉:2016年人均阅读7.86,http://book.sina.com.cn/news/whxw/2017-04-18/doc-ifyeimqy2574493.shtml]。公共图书馆是收集、整理和保存文献资料并向读者提供利用的科学、文化、教育机构,有义务也有责任通过阅读推广引导读者建立正确的阅读趋向。

同时,进入21世纪后,随着信息技术的不断发展,人们被大量的信息和数据包围(根据原国家新闻出版广电总局发布的统计数据,2016年全国共出版图书499884种、期刊10084种、报纸1894种、录音制品8713种、录像制品5671种、电子出版物9836种[2016年全国新闻出版业基本情况,http://www.chinaxwcb.com/2017-07/25/content_358637.htm]),这让读者在阅读时有了更多的选择,但也面临着如何选择的困扰,他们希望公共图书馆的阅读推广活动能够更有针对性,更符合自己要求。本文就主要针对这一问题,探讨通过对读者数据进行挖掘分析,使公共图书馆对读者的了解更全面、更深入,进而推动阅读推广活动更有针对性和实效性,以帮助读者在信息海洋中找到所需。

图1.读者数据挖掘与阅读推广

1.阅读推广

阅读推广是指图书馆将馆藏文献分类、整理,通过开展各种阅读活动,传播给目标读者,使读者准确接受,激发阅读需求,进而实现传播阅读知识,培养阅读兴趣,促进读者阅读的目的的活动。阅读推广活动不仅是对图书等文献资源的推广、对阅读活动的推广,还是对阅读指导服务的推广,同时也是公共图书馆的自我推广。

1.1目前常用的阅读推广方式及存在的问题

目前,常用的阅读推广方式主要有:图书展览、推荐书目、名著演绎、公益讲座以及编制阅读推广手册,开展图书漂流活动、书友会活动、读书征文比赛、读书箴言征集、读书有奖知识竞赛、图书捐赠等。虽然目前部分公共图书馆的阅读推广方式已经实现了“线下到线上、单一文字到全媒体、标的到方法”的转变,但是,面对“阅读推广对知识挖掘、个性化定制等特色服务需求增加”,“读者对文献自动过滤、推送,阅读环境绿色高效要求增加”等新情况,大部分公共图书馆的阅读推广活动尚无法满足读者需求。以推荐书目方式为例,目前大部分公共图书馆的推荐书目并没有很好的针对个人的需求来推荐,往往只是简单地推荐大家借的比较多的,以及点击、浏览、下载最多的热门资源,如新书榜、借阅榜推荐等,并没有真正结合个人的个性化的需求来推荐,推荐结果的准确度还有待提高。

1.2业界关于阅读推广的研究

目前,阅读推广虽然已成为国内图情界的研究热点,但大部分图书馆的阅读推广研究局限于如何开展阅读推广活动,而阅读推广活动的研究又主要着眼于如何开好报告会、沙龙或讲座等。又或者,虽然将一些新技术引入到阅读推广中来,但是应用比较肤浅,比如:仅通过利用网站、微信来公布活动信息,收发活动进展等,这些更像是研究图书馆如何被动的去接受和应付新技术给图书馆带来的冲击。但是,据调查,国外早已开始对利用读者数据挖掘分析进行个性化阅读推广进行研究,而且有了突破性发展,如加州大学尔湾分校的Renaud和马萨诸塞理工学院的Britton等人通过大数据技术分析和挖掘了数字图书馆的读者行为信息,然后协助学校分析学生的阅读行为

康奈尔大学图书馆开发的Mylibrary(分为myLinks和Myupdates两个部分)系统,既可以让读者自己定义和组织资源,为读者提供了更个性化的服务,还可以将图书馆新到资源及时通知目标读者,类似于现在图书馆中的新书推荐,但更有针对性。可见,利用读者数据的挖掘分析,进行个性化阅读推广是公共图书馆开展阅读推广的发展方向。

2.读者数据挖掘

数据挖掘是指从已有的数据库中发现并抽取出有价值的信息和知识。从现有大量的数据中寻找数据间潜在的关联,发现被忽略的要素,获得隐含的、以前未知的信息,而这些信息对预测趋势和决策行为通常是十分有用的,常用的方法有分类、聚类、关联规则及偏差分析等。公共图书馆一开始就是知识资料存储整理的专门部门,只是面对现代知识的爆炸性增长,如果仍然采用传统的分类、统计的方法已经不能满足需求,数据挖掘技术正是解决这一问题的利器。

2.1读者数据收集

读者数据库的构建是读者数据挖掘的基础。按照来源不同,读者数据可大致分为描述型数据和行为型数据。其中描述型数据主要是指读者描述的基本信息,包括读者的姓名、性别、年龄、学历、工作、喜欢的资源类别等等;行为型数据主要是指读者的行为产生的信息,既包括读者在图书馆中留下的咨询信息、图书馆管理系统中的图书借阅信息(借阅书目信息、借阅时间、归还时间等),也包括读者访问资源过程中产生的信息,包括浏览的页面、输入的检索词、选择的检索方式、浏览历史、下载的资源、分享的资源、发表的评论等。随着信息通讯技术的发展和智能移动通讯设备的广泛应用,读者数据的产生速度飞速提升,数据量也飞速增长。但是,读者数据库的搭建并不是简单的数据堆砌,还需对搜集到的读者数据进行预处理,经过数据筛选、数据变换、数据集成和数据装入等必要的处理过程,建立一个整合的、结构化的读者数据仓库,并及时更新。图书馆通过多个渠道获取的读者数据中既有读者借阅资料的数量、Web访问日志等结构化数据、也有读者需求信息、读者反馈信息等非结构化数据。目前数据挖掘的对象主要是结构化数据,因此,应尽可能采用多种方法对非结构化的数据进行处理,将其转化为结构化数据。

2.2读者需求模型搭建

完成了读者数据的搜集和预处理之后,就可以借助人工智能、机器学习、统计分析及相关发现技术,对读者数据进行自动分析和归纳性推理,发掘出潜在的模式,或产生联想,建立读者需求模型。从某种程度上说,读者需求模型的建立就是一个将读者不断“分群——细化——验证——修正——再分群——……”的过程,即首先按照特定的数据要素对读者进行初步分群,然后再对这些读者群逐个进行分析,即随机选取一些读者,逐个解读其属性特征和行为记录,努力通过这些数据还原出读者的真实使用场景和过程,尝试推测其需求目标,并从中挖掘显著的行为模式,再根据发现的典型行为模式和场景、目标的推测,对读者群进行更细致的划分,然后通过对其描述型数据和行为型数据进行统计分析,验证推测结果,并根据结果不断修正该读者所属的群体或该读者群体的需求特征,同时,还要根据每位读者数据的不断更新进行针对性修正,读者累计数据越多,群体越细分,需求模型就越接近读者的真实需求,而读者需求越精准,阅读推广的针对性就越强、效果就越好。

3.读者数据挖掘在阅读推广中的应用

读者主导自己的阅读行为,而服务读者正是公共图书馆工作的中心,所以必须对读者数据进行充分挖掘,在阅读推广活动中把对读者的了解和服务读者的思路融入各个方面,才能让阅读推广真正吸引读者,影响其阅读行为——提升阅读兴趣和阅读能力,实现阅读推广的目的。

3.1读者数据挖掘在阅读推广中的应用

对不同读者数据的挖掘,在阅读推广活动中应用也不尽相同。具体体现在:基于读者描述型数据挖掘的阅读推广,主要是通过将读者描述型数据与馆藏资源分类标签、阅读推广活动类别标签等的相似度高低进行匹配,并向读者采用相似度最高的阅读推广方式,推广相似度最高的馆藏资源,例如读者甲在描述型数据中有“喜爱摄影”“喜欢参加讲座”等信息,则可推测该读者可能会对摄影讲座感兴趣,可将相关活动信息推荐给该读者;基于读者行为型数据挖掘的阅读推广,主要是通过对读者行为型数据进行分析,将具有某种同样行为的读者各自喜爱的阅读推广方式、喜爱的馆藏资源进行交叉推广,例如读者甲、乙两人都借阅过图书A、B,而甲还借阅过图书C,则可推测图书C也是乙可能喜欢的图书,并推荐给乙,或者,读者甲、乙都参加过图书漂流活动和书友会活动,而甲还报名了读书征文活动,则可推测乙也可能对读书征文活动感兴趣,将相关信息推送给乙。在实际应用中,经常是对读者的描述型数据和行为型数据进行交叉挖掘,利用特定的算法进行混合,以相互验证,进而提升读者需求推测的准确度,提高阅读推广活动的针对性和读者的接受度。

图2.基于读者数据挖掘的阅读推广

3.2利用读者数据挖掘开展阅读推广的优缺点

利用读者数据挖掘开展阅读推广的优点主要体现在三个方面:一是推动公共图书馆供给侧改革,为阅读推广提供更符合读者需求的文献资源,利用对读者数据的挖掘,可以发现读者的现实需求,预测其潜在需求,为公共图书馆采购新的文献资源提供依据,优化阅读推广的资源配置,同时让现有馆藏资源更易被读者发现和使用,使阅读推广活动更加有的放矢;二是推动公共图书馆读者服务创新,提升读者对阅读推广活动的接受度,利用对读者数据的挖掘,尤其是对每一位读者历史数据的挖掘,可以为其提供更加个性化的主动式服务,从“普发通知,看到参加”到“个性推广,邀请参加”,显然,后者更易为读者接受;三是增加公共图书馆与读者的互动,提升阅读推广活动实效,利用对读者数据的挖掘,公共图书馆可以预测读者没有直接描述出来的需求,并通过合适的阅读推广方式进行反馈,并通过这种“无声的互动”,对读者进行跟踪推广,使阅读推广获得更好的实际效果。但是,由于读者数据挖掘对于读者需求的预测,是建立在大量读者数据基础上的,因此存在冷启动的缺点,即对于新入馆读者来说效果不好,尤其是缺乏行为型数据,使得其读者群细分和读者需求模型没有经过修正,也就无法为其提供个性化阅读推广服务。同时,公共图书馆在挖掘读者数据的同时,还应完善网络安全体系,防止读者数据和个人隐私被截获、窃取、篡改和破坏,解除读者的后顾之忧。

4.结语与展望

21世纪是一个“知识爆炸的时代”,公共图书馆的馆藏资源越来越丰富,可供读者阅读的文献资源越来越多,面对日益增多的选择,读者也对公共图书馆的阅读推广活动提出了更高的要求。当前,国内已有部分公共图书馆意识到了读者数据挖掘对于阅读推广的重要作用,但由于受场馆信息化基础薄弱、工作人员技术素养不足等影响,对读者数据的挖掘大都停留在较浅层次,与商业化科技公司(如Amazon、淘宝、百度、网易音乐、今日头条等)在这一领域内的应用程度相差较远,但是,相信随着物联网、人工智能、云计算等技术的发展和普及,对读者数据进行深层次挖掘,将是公共图书馆阅读推广活动发展的必然方向。

参考文献:

[[[]曹畋,王黎.探究图书馆阅读推广的新技术与新趋势[J].农业图书情报学刊,2017,(12):135-138.]]

[[[]刘军军.大数据时代高校图书馆信息服务模式创新研究[J].图书馆学刊,2017,(12):60-62.

[3]曹玉枝,徐玮,巩葵花.浅析大数据思维在高校图书馆阅读推广中的应用[J].内蒙古科技与经济,2016(09):119-120.

[4]王彦力,刘芳兵,杨新涯.以信息技术为支撑的阅读推广模式研究[J].大学图书馆学报,2016,34(04):30-35.

[5]叶峥嵘.大数据背景下高校图书馆阅读推广工作研究[J].中国管理信息化,2016,19(19):203-204.

[6]张庆伟.大数据思维下的高校图书馆全民阅读推广研究[J].黑龙江畜牧兽医,2016(20):292-294.

[7]曹畋,王黎.探究图书馆阅读推广的新技术与新趋势[J].农业图书情报学刊,2017,29(12):135-138.

[8]龚军.大数据时代我国阅读推广特点及措施探析[J].兰台世界,2017(24):74-77.

[9]李和娟,惠青.大数据背景下的图书馆阅读推广服务策略[J].科技视界,2015(02):39+175.

[10]牟静.大数据环境下的高校图书馆阅读推广研究——利益相关者共赢视角[J].图书馆研究,2015,45(01):72-75.

[11]熊莉君,张福阳,张灿,熊文龙.数据驱动的图书馆阅读推广机制探讨[J].四川图书馆学报,2015(04):31-34.

[12]李纪惠.大数据背景下高校阅读推广活动的思考[J].图书馆界,2015(04):61-63.

[13]陈国兰.大数据时代高校图书馆阅读推广工作研究[J].情报探索,2015(10):75-78.

[14]孙玉艳.大数据时代高校图书馆全媒体阅读推广模式的探讨[J].农业图书情报学刊,2017,29(01):80-82.

[15]于新国.高校图书馆大数据文献数字化阅读推广创新模式研究[J].图书情报论坛,2016(06):1-4+8.

[16]刘丽杰,范凤霞.大数据环境下高校图书馆阅读推广策略与实现路径[J].西南民族大学学报(人文社科版),2017,38(08):225-228.

作者简介:杨赟(1986-),女,深圳市宝安区图书馆馆员。