个性化推荐(精选5篇)

| 婕音

推荐文章

菁英职教网 培训啦 留求艺

个性化推荐范文第1篇

关键词 旅游微博;个性化推荐;效果评价体系

中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2013)23-0072-02

1 研究背景

随着我国经济水平的提高,人们对于旅游的需求也越来越多,如何开发基于大众市场需求的新产品和服务来改善旅游服务的质量和推动旅游业的转型成为目前旅游业发展的重点。旅游业属于信息密集型产业,适合利用互联网和移动通信等新一代信息技术对其旧有的服务模式和产品进行新的创新,这也是旅游业成长的关键力量。微博是Web2.0技术在博客领域的新发展,是一种基于用户关系的信息分享、传播以及获取的平台。由于微博兼具即时聊天工具的个体性、即时性,博客空间的个人信息和分享性,社区论坛的话题讨论性,以及SNS社区的人际关系纽带性,这使其成为一个天然的口碑传播平台。也因为利用微博进行旅游营销具有展示个性化、传播互动化、信息延展化、传播移动化、内容微小化等诸多优势,因而,它成为旅游企业营销关注和挖掘的新领域。

微博让用户可以更方便、快捷地通过虚拟网络获取实时、海量的旅游信息,使旅游企业能接触到潜在用户、信息、与游客互动、推销旅游产品。然而,由于微博高速、海量的传递信息,内容更新极快,造成信息冗余,搜索起来比较困难,这导致信息过载现象的产生。目前主要使用信息搜索和信息推荐两种技术解决这一问题。但是,传统的信息搜索算法只能呈现给微博用户相同的排序结果,无法针对不同微博用户的兴趣爱好提供用户个性化的信息,最终导致用户很难找到符合自己个性化需求的信息。信息推荐则可以主动为用户提供满足用户需求的个性化信息。因此,帮助用户从海量、更新极快的微博信息中获取有价值的知识和最新信息,提高信息检索与推荐的智能化水平,满足各个用户不同的个性化需求,已经成为一个非常重要且极具现实意义的研究热点。从普通用户的角度看,微博个性化推荐的研究可将用户从无限的网络资源中解放出来,大大缩短用户信息检索的时间,提高信息服务的效率,有效解决信息过载的问题。从旅游企业的角度来看,精准的个性化推荐技术有助于它们找到目标人群,有针对性地开展相应的微博活动营销和提供个性化的服务,使其以较低的成本将产品与服务更有效、快捷地推向目标消费群体。

2 国内外研究现状

从文献调查中发现,围绕旅游围博平台的研究有不少,但主要研究的是旅游微博营销策略和应用等方面的内容,有少量对旅游微博信息的信度和效度进行了研究。对于旅游微博的个性化推荐效果方面的研究则基本没有。然而,国内外关于微博个性化推荐系统的关键技术研究成果有很多,如好友推荐、散列标签推荐或时事信息推荐等。胡大伟提出一种基于关联规则和标签的个性化好友推荐系统,推荐与目标用户最相似的微博用户为好友。孙明明研究了基于云计算环境下研究微博用户的协同过滤推荐,发现现有经典算法推荐精度较低,设计出一种新型的更适合于微博平台的EssCF推荐算法。有少量研究根据微博内容和用户位置进行了深入研究,如Horozov在移动端用户地理位置获取的基础上,增加了“便捷性”参数,以满足系统的可扩展性和低时延需求。此外,还有部分研究从微群和微博平台全网两方面来展开关系推荐的研究。到现在为止,现有研究大多侧重于微博个性化推荐算法和系统的构建及提高推荐精度的理论研究上,部分研究对其所提出的改进算法的有效性进行了一定的实验证明,但对于现有的微博个性化推荐技术的总结分析,尤其是推荐效果的对比分析则较少,也很少涉及到面向具体行业和细分市场的微博个性化推荐、推荐策略和推荐效果分析等实用性方面的研究。而在实践中,在不同的行业里,用户期待的推荐形式、内容和对推荐质量的预期不同。因此,对于旅游企业而言,它们需要的是一种具体化、符合行业和微博特性、实用性极强的微博营销策略,了解目前微博个性化推荐技术效果会有助于他们制定更有效的微博营销活动,而目前恰恰缺少这方面的研究成果。

3 旅游微博个性化推荐效果评价指标构建

微博个性化推荐效果决定用户是否会采纳推荐内容,也影响着企业微博营销的效果。自推荐系统的概念提出以来,推荐效果的评价指标主要是通过评估系统的准确性、多样性、新颖性和覆盖率来进行评估,这些评估指标属于基于数据本身的指标。在实际应用中,效果的好坏还和商业应用上的关键表现指标及用户真实态度有关,但这方面的研究则十分欠缺。因此,如何评价微博个性化推荐效果是一个很大的问题。已有的研究普遍以Davis(1989年)提出的TAM模型理论作为理论基础去解释用户采纳微博个性化推荐的过程和影响要素,并在此基础上增加情感性、社会化要素来扩展TAM模型,由此对微博个性化推荐的效果进行验证,也获得一定的研究成果。但以此验证的效果并不等于用户实际的采纳行为,用户行为化指标的欠缺使得现有研究成果难以得到广泛推广。同时,现有研究对于微博个性化推荐效果的影响因子探索较浅,未涉及用户心理变量因素。

3.1 旅游微博个性化推荐效果评价体系

态度是个人对环境中某一事物的评价和心理倾向,是一种内在的心理结构和行为倾向,对个人的行为具有重要的影响意义。用户对主动获得的旅游微博个性化推荐内容的态度影响着他们是否接受推荐,因此,用户的态度表现是我们构建评价体系的一个主要指标。

传递旅游地信息和推动旅游营销活动是大部分旅游企业运营微博的目的,其商业潜力的大小决定旅游企业在微博的资金投入比例。旅游微博个性化推荐效果的好坏对商业潜力有极大的影响,所以在评估旅游微博个性化推荐效果时,我们将商业表现作为评价体系中的主要指标。

基于此,我们构建的旅游微博个性化推荐效果评价指标体系如下。

旅游微博个性化推荐效果评价指标 一级指标 二级指标

系统表现 准确性

多样性

新颖性

覆盖率

商业表现 转化率

购买率

浏览量

转发量

收益率

购买品种数

客单价

态度表现 认知

情感

意向

表1 旅游微博个性化推荐效果评价指标体系

态度表现指的是用户个人对个性化推荐内容的态度。由于个人态度的心理结构主要包括认知因素、情感因素和意向因素,所以我们将这三个因素作为二级指标来评估个人的实际态度。认知指标主要指用户对推荐结果的认知,如推荐有用和易用,推荐内容的赞成或反对,情感指标则检验指用户对推荐内容的喜欢或厌恶,意向指标评估用户对推荐结果是反应倾向。

3.2 旅游微博个性化推荐效果分析建议

在对旅游微博的个性化推荐效果进行分析时,可使用在线评测和离线评测两种方式,按照以上所构建的个性化推荐指标体系从系统本身、商业潜力和用户态度三个方面进行全面的调查分析,旅游企业即可获得一个比较全面的微博个性化推荐效果报表。在线评测主要是设计在线用户实验,根据用户在线实时反馈或时候问卷调查等结果来衡量微博个性化推荐系统的表现。离线测评即根据收集到的实验数据,根据评价指标来衡量其质量。随后通过分析微博的点击流数据,获取如转化率、购买率等商业指标,分析其商业潜力。最后利用调查问卷方式调查旅游微博用户对目前系统的心理态度,接受情况。

为了进一步改善个性化推荐效果,旅游企业还要采用问卷调查、深入访谈等方式收集信息了解微博用户关注旅游微博的主要目的有哪些,根据用户对旅游微博的实际需求撰写符合其需求的微博内容。

4 总结

本文对微博个性化推荐技术及其效果分析的研究进行了全面的整理和分析,在分析的基础上,构建了一个较为全面的旅游微博个性化推荐效果评估体系,为旅游企业的微博营销工作提供理论依据。不足之处是未进行进一步的实验验证该评估体系的全面性、准确性和可靠性,这是我们在下一步需要完成的工作。

参考文献

[1]倪琳.微博的传播特性及影响力研究[J].上海商学院学报,2011,12(2):39-43.

[2]刘宏盈,唐羽佳.旅游产品微博营销策略研究[J].商业研究,2013(2):212-216.

[3]张树萍,王西荣,孙贤斌.微博营销:数字时代旅游景区(点)营销的新途径[J].皖西学院学报,2011,27(5):108-111.

[4]韩朝阳,张仁军.面向旅游应用的微博信息信度和效度评价[J].重庆理工大学学报.2011,25(10):37-40.

[5]郑志娴.微博个性化内容推荐算法研究[J].电脑开发与应用,2012,25(12):23-25.

[6]胡大伟.基于标签协同过滤算法在微博推荐中的研究[D].包头:内蒙古科技大学,2012.

[7]孙明明.基于云计算的微博推荐系统[D].南京:南京理工大学,2012.

[8]T Horozov, N Narasimhan&V Vasudevan. Using Location for Personalized POI Recommendations in Mobile Environments[C]//Proceedings of the International Symposium on Applications Internet,2006.

个性化推荐范文第2篇

[关键词]个性化;推荐算法;协同过滤

doi:10.3969/j.issn.1673 - 0194.2015.08.059

[中图分类号]TP301.6 [文献标识码]A [文章编号]1673-0194(2015)08-0078-02

由于网络数据正在快速的发展,人们能够接触到的海量的信息,例如,拥有数百万种独特商品的亚马逊,在Google Music曲库中,有上千万首歌曲,淘宝在线商品数量达到8亿件以上,腾讯微信用户以及新浪微博用户都超过5亿以上,这些用户很难在海量的信息中找到自己喜欢的信息,也就是所谓的“信息过载(information overload) ”的问题,而推荐系统和搜索引擎是解决此问题的关键技术,和搜索引擎相比较,用户更喜欢使用个性化的推荐系统,这是由于个性化推荐系统能够主动的对用户浏览过的日志、注册的信息以及历史评分记录等方面进行分析,从而找出用户更感兴趣的项目特征,然后对用户感兴趣的信息进行私人定制,根据用户项目信息和用户需求,对推荐的内容和信息的变化进行及时的调整,实现“以用户为中心”的服务。对个性化推荐算法进行设计,能够有效的解决当前信息过载的问题,让用户更快捷、方便的进行对信息的搜索和浏览。

1 个性化推荐系统的概念

个性化推荐系统主要根据用户喜好特点以及拥有的购买行为,从而自动的推荐用户有兴趣的商品或者是信息。这种系统的出现是由于电子商务规模的扩大,使商品数量以及信息等都在上涨,用户在这种情况下,需要用大量的时间才能够找到自己喜欢的信息,因此,为有效的解决这个问题,个性化推荐系统就此诞生。也就是说,个性化推荐系统是一个拥有在大量数据中挖掘的能力,从而形成的高级智能商务平台,能够帮助电子商务网站为顾客提供的完全个性化的信息服务以及决策支持。如图1所示。

2 个性化推荐算法的分类

推荐系统是利用信息源给用户进行预测和项目推荐,在整个过程中,具有重要的作用。根据信息的不同。比如,信任度、标签、人口统计信息等,以及对评价指标的考虑。

2.1 基于内容的推荐算法

这种推荐法也称为基于内容的信息过滤推荐(content-based recommendation),基于内容的推荐算法不需要用户对推荐对象给予评价,但是要把推荐对象的特征进行抽取出来,从用户以前所选择的对象内容去感应用户的偏好,然后用于偏好相似的对象推荐给用户。其效用函数( u,c)可表示为f( u,c) = score( ContentbasedProfile(u) ,Content(c))。Score 可以用二者的余弦相似度进行计算。最后用所得到的函数值对其进行排序,将最前面的项目当做推荐对象。该算法的推荐结果虽然符合用户的喜好,但是缺乏新颖度。

2.2 协同过滤推荐算法

该算法是根据系统里其他用户的历史数据或者评分记录(比如,亚马逊用户购买商品的记录),协同过滤推荐( collaborative filtering recommendation)是当今最为流行的一种算法,目前,主要的协同推荐技术有两种,一种是基于模型的协同推荐,一种是基于内存的协同推荐,基于模型的协同推荐是通过历史数据预测模型,然后通过模型参与评分预测,后者是使用历史记录数据进行的预测模型,它们的不同是由于客户的偏好。

2.2.1 基于模型的推荐算法

项目数量及用户规模的增长,致使出现数据集稀疏的问题愈加严重,比如,Netflix的影评数据集就缺失大约99%的数量,因此,基于内存的协同算法要将大规模的增长,而且,由于数据出现稀疏的现象,推荐结果的质量就会产生下降的趋势。基于模型的推荐算法( model-based collaborative filtering),其中心思想就是利用客户的评分结构进行评分预测模型,从而使用了数据挖掘计算模型和多种计算学习,通过模型实现对评分的预测。

2.2.2 基于内存的协同推荐算法

根据对基于内存协同推荐的考虑角度的不同,可以将其分为基于用户( User-based) 和基于项目 ( Item-based) 的协同推荐。基于内存的协同推荐( memory-based collaborative filtering)也叫做启发式的协同推荐,能够对用户的历史数据进行分析从而提供预测结果,比如,用户-影评矩阵。在 User-based 模型中,用户间相似度能够选择不同的相似度函数来计算。

3 个性化推荐算法常用的数据集

3.1 Netflix 数据集

这种数据集主要是来自电影网站的Netflix,这个网站有480 189位用户对17 770部电影进行了共有100 480 507条的评分记录,数据区间为[1,5]的离散整数值,与MovieLen 评分有所不同,Netflix目前是全球规模最大的电影评分数据集,但由于该比赛已经结束,因此,该数据集目前已不对外开放。

3.2 腾讯微博数据集

在2012年,由于数据挖掘与知识竞赛(KDD-Cup),因此,腾讯微博数据集形成,此数据集是在腾讯4.25亿微博用户中,经过50天的数据采样得到的。该数据集有6 000万信息员或被推荐用户、300多万收听动作和3亿多条推荐记录,该数据集的规模现已超过原来的 KDD Cup比赛。

3.3 Yahoo! 音乐数据集

该数据集主要包含了用户对专辑、单曲、歌手等不同音乐元素进行评分,对于评分的区间是0-100之间的证书,一共涉及624 961个音乐元素,1 000 990 个用户,262 810 175条评分记录。

3.4 CiteULike 数据集

该数据集是由施普林格出版社( Springer)提供协助用户管理、存储及分享学术文章的网站,用户可以根据自己感兴趣的论文,给它们打上标签,从而可以在专门的地方查找到,并且还能够为其他选择论文的朋友提供依据。CiteULike 公布了包含给论文打标签和收藏论文的数据集,其中,这个数据集有1 793 954篇论文、52 689个用户和2 119 200个用户与论文间的关系。

4 结 语

个性化推荐在电子图书、电子商务等领域被广泛的应用着,随着个性化推荐系统的不断的变化,推荐算法逐渐暴露出越累越多的缺点,有待解决。因此,对个性化推荐算法设计进行研究,不仅能够实现完善个性化推荐系统,同时还能够促进企业的可持续发展,进而为社会做出贡献。

主要参考文献

[1]赵亮,胡乃静,张守志.个性化推荐算法设计[J].计算机研究与发展,2012(8):986-991.

个性化推荐范文第3篇

【关键词】个性化推荐系统;中职;大数据;驾驭

计算机技术的迅速发展和广泛应用,使大数据成为计算机技术的必然产物及各个领域的热门话题。大数据对社会经济、政治、生活以及文化等方面都有着深远的影响,为各个领域带来了机遇和挑战,教育领域也不例外。随着大数据概念和个性化推荐系统的引入,教育信息化也展现出前所未有的发展趋势,可以说教育和计算机技术的相融合,不仅提高了学习者整理和分析信息的能力,同时也推动了教育改革和教学创新。

一、大数据和个性化推荐系统

1.1大数据的概念

大数据是人们在长期应用和研究数据的基础上,尤其是随着计算机技术的深入应用,在大量数据的背景下营运而生的,可以从众多无规则的数据中整理、筛选出有价值的信息,从而为各行业服务,因此,大数据也称为“巨量资料”。当前,大数据已经不再仅局限于描述和存储海量数据信息,同时还可以帮助人们客观地发现隐藏在海量数据背后有价值信息的真相。

1.2个性化推荐系统

个性化推荐系统则是基于用户基本特点及实际需求,从而为广大用户提供相应的个性化服务,目前有众多研究者和开发者不断研究和使用个性化推荐技术,例如视频网站、社交网站和购物网站都实现了个性化推荐服务,但是至今为止,个性化推荐系统的概念和定义还不够明确,通常情况下是采用Resnick和Varian在1997年关于个性化推荐系统的定义:个性化推荐系统则是在计算机技术及网络技术应用基础上,针对广大用户实际需求提供相应的商品信息及建议,从而为用户产品购买提供相应帮助,也就是模拟产品销售人员对用户产品购买提供帮助的过程。

二、个性化推荐系统设计

2.1大数据环境下的个性化推荐系统

大数据环境中信息过载已成为事实,个性化推荐系统是在帮助教学过程参与者,即教师和学生,快速有效地获取所需项目对象的目的下产生的。推荐系统在个性化教学中得到了充分的应用,例如在中职《Java程序设计基础》课程学习中,有大多数学生都做错了关于“插入排序算法”的题,但是在浏览学校论坛文章的数名学生中,有78%的学生都不会在再次做此题时出错,因为当有学生犯同样的错误时,推荐系统会自动推送相关论坛文章帮助学生解答疑惑,在这里,确定适合学生学习的论坛内容凭借的是“项目相关计算”的手段,而不是根据学生的自行判断。

2.2了解用户需求分析

个性化推荐系统的用户多为中职院校的学生,主要是将网络学习作为主要学习方式或者辅助方式,用户通常也就是计算机专业学生或者是熟练应用教育资源网站的学生和教师等。针对学生来讲,传统教学模式需要受到时间空间的限制,无法实现面对面指导,因此学生在采用网络学习过程中往往会出现一定的迷茫,无法在大量网络数据中迅速找到自己所需的学习资源,消耗时间比较长。而推荐系统的主要功能就是可以根据学习者的特点和学习兴趣,可以为学习者推荐合适的学习资源,从而有效地为用户提供个性化资源服务[2]。另外在进行资源推荐过程中通常出现一个URL,所以当学生对资源点击下载时,程序会通过URL从网络上下载与学习资源相应的资源。当学习资源被下载到手机客户端时,学习者则可以结合自己的实际需求,不受时间及空间限制下载资源查看、标记及共享等等,并且学习者关于这一资源的相关操作,均会在客户端上进行详细记录并传送,进一步被服务器所记录并保存到数据库中,以便对学生的推荐资源进行计算。随着学生使用推荐系统时间的增加,服务器在学生输入信息记录过程中也会有显著提升,这样也就进一步提高推荐系统服务准确性。可以说个性化推荐系统就像电子购物网站一样,可以根据学生的具体需求、学习风格以及学生的浏览记录作为推荐依据,从而为学生推荐适合的学习资源,大大提高了学习者寻找资源及学习的效率。

三、个性化推荐系统在中职教育中的应用

3.1更新了教育理念、教学思维及教学评价

随着大数据时代和个性化推荐系统的深入推进,中职教育理念、教学思维及教学评价等方面都发生了更新和变化。在大数据时代,教育领域充满了海量数据,如学校教师和学生的言行举止、学校里的事物都可转化为数据信息。中职学生在用计算机终端学习时,通过研究学习者的活动轨迹和系统的推荐,包括作业完成情况、课堂言行、师生互动、自主学习及同学交流等活动,都将成为教育大数据的来源,此时大数据环境下的个性化推荐系统也比传统数字更具有含义和价值,其可以通过大数据技术层面对教学活动进行分析、评价及提高,而教育也不再是依靠教学经验和理念来传授知识[3]。可以说,个性化推荐系统将步入实证时代,变成一门基于数据研究的学科,充分挖掘符合教学和学生的教育、学习及评估等实际情况,从而规范地制定和执行教育规则,构建更加符合中职教育的教育教学策略。

3.2实现课堂教学、学生学习差异及个性化需求

大数据环境下的推荐系统具备的一个显著特点就是充分体现了学生学习和课堂教学真正意义上的个性化。例如美国的科罗拉多州的一所学校实施了“教育信息系统计划”,其是通过收集、整理及分析学校教师和学生的所有信息,旨在更好地帮助学校改进教学手段,更好地帮助学生获得学业上的知识。系统设计的重点是将所收集到的学生和教师的数据内容通过计算机信息技术联系起来,通过推荐系统的数据分析,让教师在获取更全面和更丰富的教学资源的同时,了解采用哪一种教学手段对学生的授课最有效,同时还可以及时了解到学生在学习过程中遇到的困难,并针对学生的特点进行个性化教学活动设计、学习计划以及对差异化的教学方案进行创新,从而大幅地提升教学质量。而学生则可以在教师的针对性指导下,提高自己的成绩和综合素质。

3.3提高和完善了学校的管理体系

学校是培养人才、传授知识及创造知识的场所,在学校管理中不管是活动控制还是决策,均需要一定的信息,比如在进行目标制定、教学计划设计以及教学组织评估过程等等。而个性化推荐系统在中职教育中的应用,不仅提高了教育管理,同时也实现了教育教学的科学化和精细化。推荐系统中不仅蕴藏着海量的资源信息,并且还可以在收集整理信息的同时产生新的数据,由此可见大数据处理及推荐系统在学校管理各个部门及活动中有着重要的作用,其可以对学校进行系统的规划和梳理,将所收集到的数据信息细化和标准化。同时,针对学校管理的数据或者对象,推荐系统可以从不同维度记录数据和对象,同时不同数据也能够实现印证,有助于构建多源管理大数据,重点集中在过程管理、活动管理及决策管理过程中,从而最终在学校管理大数据中[4]。

四、总结

大数据时代的到来和个性化推荐系统的推进对教育领域而言是新生事物,但其也是教育领域未来发展的必然趋势。围绕大数据环境下的个性化推荐系统在中职教育中的深入应用,软件开发者需要在今后的研究实践中不断地进行探索和发现。随着个性化推荐系统及其相关技术的完善和广泛使用,其在教育领域中的研究将会越来越全面和深入。

参考文献

[1]金志福.基于大数据的教育资源个性推荐系统设计与实现[D].中国科学院大学,2015.

[2]尤伟静.简析大数据及其在教育领域的应用[J].科学时代,2015(10).

[3]高建煌.个性化推荐系统技术与应用[D].中国科学技术大学,2010.

个性化推荐范文第4篇

关键词:协同过滤;基于用户;基于物品;相似程度

一、协同过滤推荐的研究现状

首先了解一下推荐系统,比较普遍认可的定义是Resnick和Varian在1997年[1]提出的:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定购买什么产品,模拟销售人员帮助客户完成购买过程。”而协同过滤是推荐系统中最常见也是最广泛应用的推荐方法。Grundy书籍推荐系统[2]是公认的第一个对协同过滤应用的系统。还有Tapes-try邮件处理系统[3],Ringo[4]等。Sarwar等[5]提出的利用夹角余弦来计算产品的相似程度。Chen和Cheng[5]通过观察不同产品在用户的列表次序来计算用户与用户的相似程度.而Yang和Gu[7]利用建立用户的兴趣点来计算用户与用户间的相似程度。

二、协同过滤推荐的主要思想

协同过滤推荐的思路可以说是来源于生活。通过在生活中购买产品你会发现一些有趣的现象。比如说,人们总是更倾向于相信来自熟人的推荐,在你的朋友圈内,很多朋友都在使用同一种产品,那么你就也会很大程度有意的选择此产品。另外就是,在你对某种产品感兴趣时,当你发现有和你感兴趣的这种产品类似的产品,与此同时,其他购买者对这种产品的体验良好,那么你也很可能会购买这种商品。协同过滤的主要思想可以分成两个部分:一是通过分析用户以往的购买或者选择信息,来计算用户之间的相似程度,通过相似程度高的用户可以说是近邻对一个产品或信息的偏好来预测目标用户的对此产品或信息的偏好程度。二是通过分析对用户以往对某类产品的评价情况来预测该用户对此类中新产品的偏好程度,及计算以往评价过的产品与要推荐产品间的相似度。

协同过滤推荐主要有两种,一个是基于User的,另一个是基于iterm的。

1、基于用户的方法主要是寻找与目标用户相似的用户,认为有相似偏好的用户可能对某个产品或信息有相似的评价。通过利用相似近邻的偏好程度来进行对目标用户的评价的预测。比如说有三部电影《饥饿游戏》《千与千寻》《分手大师》。A下载了《饥饿游戏》,播完了《千与千寻》,没播完《分手大师》。B多次观看《饥饿游戏》,播完《千与千寻》,没看《分手大师》。C下载了《分手大师》,没看《饥饿游戏》,没播完《千与千寻》。那么可以看出来A与B很相似,那么再出现一个电影《变形金刚》,A是多次观看,那么应该把变形金刚推荐给B而不是C。关于这个用户之间相似程度的计算,可以通过对电影的评分机制进行量化,然后利用夹角余弦来计算用户之间的相似程度。设用户i和用户j在n维对象的空间上的评分向量为i,j,那么计算cos(i,j)的公式为:

cos(i,j)=i・j|i|*|j|

若两个用户的夹角余弦值相近,则可认为他们是相似用户。

关于相似程度的计算还可以通过皮尔森相关系数和修正余弦函数相似性等很多方法。

2、基于物品的方法主要首先是计算物品与物品之间的相似程度,然后结合用户以前的购买评价过的物品或选择行为,最后对用户进行某种新物品的推荐。比如说A喜欢看《分歧者》,《复仇者联盟》,《超体》。然后有两部电影《何以笙箫默》和《敢死队》。可以很明显的看出可以向A推荐《敢死队》。基于物品的系统过滤在计算物品的相似度时,也是可以通过评分量化,很多时候也是可以加入tag技术,对物品打标签,做标签矩阵。比如A喜欢的电影中《分歧者》是有动作,爱情,科幻三个标签,每个标签的权重不一样可以按0到1之间的分值设定。然后同理其他电影,最后通过量化计算相似度发现《敢死队》更符合推荐。关于tag矩阵也可以是0-1矩阵。关于计算相似程度与(1)中提到过的方法类似。

三、协同过滤推荐的优缺点

协同过滤的优点有:

1、可以进行过滤复杂性的,机器难以进行提取有效自由文本的信息,如音乐,图像等艺术类信息。

2、相对容易给用户制造惊喜。与基于内容的推荐不同,推荐给用户的物品内容可能是用户不太熟悉的内容,很可能发现用户潜在的喜好但用户本身却没有意识到的。

3、用户的不断增加,协同过滤推荐系统的性能也会增高。

协同过滤的缺点:

协同过滤推荐算法的典型缺点就是稀疏性问题和冷启动问题。冷启动问题就是,当有新用户进入时,由于没有历史行为数据而无法对其偏好进行判断,因此对其进行推荐。同样当有新物品进入系统时,由于没有用户对其评价过,它就得不到推荐。

四、总结

个性化推荐服务实质就是有效率有针对性的解决大量数据的问题,推荐算法在一定程度上实现了这个问题,可是现实生活中,并不是一个算法,而是好几种类型的推荐算法混合运算,最后得出的推荐结果才能比较令人满意,也会比单一算法精确很多。关于推荐系统性能的评价指标最典型是精确度和推荐效率这两个指标。其中衡量精确度可以是平均平方误差,平均绝对误差和标准平局误差等。个性化推荐没必要非得追求完全精确,因为本身推荐的内容就无法保证用户百分之百的感兴趣,但是还是要努力不断追求精确度,这样才能发挥其自身解决超载问题,给用户提供感兴趣物品或信息的价值。网易云音乐作为音乐行业的后起之秀,在个性化推荐方面做的相当不错,很多用户反应网易云音乐的个性化推荐总是给人惊喜,虽然网易没有在这方面给出过多的介绍,但是不难看出,他们公司非常注重这个方面的功能板块。因此对这个时代而言,不仅仅是对电子商务方面,个性化推荐的价值以及意义都是非常重要的。(作者单位:河北大学)

参考文献:

[1] Resinick P,Varian H R.Recommender systems[J].Communications of the ACM,1997,40(3):56-58.

[2] Rich E.User modeling via stereotypes.Cognitive Science,1979,3(4):329―354.

[3] Goldberg D,Nichols D,Oki BM,et al.Using collaborative filtering to weave an information m ACM,1992,35(12):61―70.

[4] Shardanand U,Maes P.Social information filtering:Algorithms for automating`Word of Mouth'.Proc Conf Human Factors in Computing Systems Denver,1995:210―217.

[5] Sarwar B,Karypis G,Konstan J,et al.Item-based collaborative filtering recommendation algorithms.Proc 10th Int' l WWW Conf,Hong Kong,2001:1―5.

个性化推荐范文第5篇

关键词:电子商务;Web使用挖掘;Web推荐;频繁序列模式

中图分类号:TP393文献标识码:A 文章编号:1009-3044(2008)16-21279-03

Realization of Data Mining in E-commerce Website

XU Chun-xuan1,JIANG Wei2

(1.Beijing United University,Beijing 101200,China;2.Shandong Institute of Occupational trade,Weifang 261011,China)

Abstract: As the rapid development of the Internet, the technology of Web mining has become a hotter research field of data mining. This paper discusses the characteristics and methods of Web mining, which provide an idea of unifying structure of Web links to supply the data pretreatment in order to identify user session more precisely. While browsing pattern is being mined, the Web content clustering and the users clustering are unified to enhance the recommendation system performance.

Key words: E-commerce; Web usage mining; Web pages recommendation; Frequent sequence patterns

0 引言

随着数据库技术的不断发展以及数据库在信息管理中的广泛应用,数据库中存放的数据急剧增大,导致了知识发现和数据挖掘领域的出现。数据挖掘通过发现有用的新规律和新概念,提高了数据拥有者对大量原始数据的深层次理解、认识和应用[1]。它可以通过分析企业的原有数据,做出归纳性推理,预测客户行为,帮助企业决策者调整市场策略,减少投资风险。

由于各类电子商务网站的兴起,电子商务的业务竞争比传统的商务竞争更加的激烈。仅凭传统商务网站的静态连接是不可能适应现代社会的高速要求,也不可能满足更多的客户需求,更不可能争取更多的业务量。理想做法是把客户真正需要的信息推到客户面前,以此来吸引客户的关注。那么如何快速地分析出更准确、更有用的客户信息,从而对网站进行决策支持,如何为客户提供其相对感兴趣的商品信息,建立个性化的电子商务网站,这就需要在电子商务网站中运用数据挖掘技术,建立个性化的电子商务网站。

Web挖掘是指利用定性归纳、分类学习、关联规则挖掘、聚类分析等数据挖掘算法,从与Web相关的资源和用户浏览行为中抽取感兴趣的、有用的模式等隐含的信息。根据挖掘对象的不同,可以将挖掘分为三大类:(1)Web内容挖掘(Web Content Mining),在人为组织的Web上,从文件内容及其描述中获取有用知识的过程。(2)Web结构挖掘(Web Structure Mining),从Web链接结构中获取有用知识的过程。(3)Web使用记录挖掘(Web Usage Mining),也称为Web日志挖掘,是从Web的存取模式中抽取有价值的信息和模式的过程。

1 问题分析

个性化推荐技术是电子商务推荐系统中最核心、最关键的技术,很大程度上决定了推荐系统性能的优劣。

近年来,对于Web使用挖掘的兴趣和工作逐渐增多,它也成为对客户的行为模式进行捕捉和建模的一种根本方法。一个非常成功并被广泛应用的个性化推荐技术是协同过滤技术(CF,Collaborative Filtering)[2,3]。给定一个目标客户的活动记录,协同过滤技术比较该记录和其他客户的历史记录以找出与当前客户最相近的K个客户,这些客户与当前客户有着相同的兴趣,找到的邻居就用来向当前客户推荐其未访问或购买的项目,它最大的优点就是对推荐的对象没有特殊的要求。利用协同过滤技术的系统有著名的GroupLens/NetPerceptions[4]、Ringo/Firefly[5]等。基于CF的技术存在着缺陷,它需要通过在线方式形成邻居的格式状态,随着用户数量的增加,计算量呈线形性增加,对于在大规模的数据集上提供推荐服务将导致不可接受的延迟。同时,还存在新加入项的问题,即冷开始问题,由于新加入的用户或资源还没有被访问或评价,造成新用户和新资源得不到推荐[6]。还有其他的一些推荐方法,如给予用户信息统计的推荐技术,它是先将用户根据个人属性进行分类,然后再基于类对类中的用户进行推荐[7],在文献[8]认为显式输入用户属性的优点是简单,并且能够准确表达用户的兴趣,但是却很难收到成效。原因有用户很少主动表达自己的喜好、用户对问卷调查会产生厌倦、只能静态被动的接受用户的信息,不能将用户喜好的转移而自动修正用户的兴趣。

2 基于Web使用挖掘技术的推荐

目前,比较流行的技术是利用用户的Web日志进行挖掘,其中的数据预处理和日志挖掘算法是Web挖掘中的关键技术。Web日志挖掘主要提供面向用户的信息分析,所以首先要从Web日志中识别出用户会话(User Session),作为日志挖掘的基础。目前用户会话表示方法考虑到用户页面访问的时间顺序问题,可以通过访问的Web日志来预测用户的访问行为和网站周期性的访问行为,一般采用将用户会话表示成浏览页面的页面序列,它能够表示访问页面的时间序列。但是这种方法也是存在着缺陷:这是由于用户浏览页面是基于多个浏览窗口同时访问网站,因此可能用户在同一时间访问多个页面,这多个页面可能是通过同一个页面建立的不同超级链接,也可能是通过多个页面进行链接的。这样可能这些页面的访问顺序关系可能并不重要,如果将它们强行建立关系得话也没有多大的意义[9]。这是在进行日志挖掘时需要考虑的问题之一。

基于日志文件的Web使用挖掘推荐系统并不完美,仍然存在着以下的缺点[10]:首先采集到的数据不完全或者有限问题。在应用数据挖掘算法之前,往往要使用启发式规则帮助形成数据,这会使产生的用户模式不正确或者不合适。其次不正确的数据误导问题。当用户不再对网站进行访问时,其浏览信息还在日志文件中,这些数据可能会误导对其他用户的推荐。再次资源推荐的持续问题。当网站增加新网页时,由于这些网页从来未被访问过,即使与用户的兴趣相符合,推荐系统也很难发现并将其推荐,这也是一个冷开始的问题。而过去的兴趣页面也因为不断的被推荐,而引来更多的访问,再进行推荐,如此往复系统会停留在对过去兴趣页面的无限推荐当中,造成推荐资源的新颖性不足。这又是进行日志挖掘时需要考虑得到的问题。

3 结合聚类和Web使用挖掘的推荐方法

3.1 数据预处理

Web日志数据预处理的过程就是经过一系列的数据处理转化为用户会话,通常采用图所示的数据预处理过程。

图1 典型的Web日志数据预处理过程

我们对日志数据进行了数据净化、用户识别、会话识别和路径补充这四个预处理步骤,将原始的日志文件转化为用户会话文件和页面/标识符索引文件。

数据预处理的结果作为日志挖掘算法的输入,直接影响挖掘的质量,因此改进Web日志数据预处理技术可以有效地提高Web日志挖掘结果的质量。

在进行数据预处理时,考虑到用户浏览页面可能是基于多个浏览窗口同时访问网站,因此可能用户在同一时间访问多个页面,这多个页面可能是通过同一个页面建立的不同超级链接,也可能是通过多个页面进行链接的。这就需要在数据预处理的过程中,考虑到页面的链接结构。也就是说不仅仅需要在日志中通过时间限制进行用户的会话识别,而是在以前普通会话识别的基础上考虑站内页面的连接结构,将同一会话内无连接关系的页面再划成不同的会话。

如图2。

图2

这可能是用户的一个浏览图,用户在A页面可能同时点击了其上的三个链接B、C、D,我们其实并不在意这三个页面的时间序列问题,而在意的是他们都是通过页面A来进行链接的,以及通过这三个页面用户有访问浏览了哪些页面。而在以往的用户识别中,可能会将B、C、D划分到同一会话中并且有一定的序列。如可能存在,如果这个路径满足了频繁访问路径的条件,在以后别的用户访问网站时,就可能进行推荐,而这种推荐却是毫无意义的。

因此在进行数据预处理时,要考虑到网站内网页的链接结构,从而有利于发现用户的向前引用事务[11]和用户的偏爱浏览路径。

3.2 聚类的使用

在前面分析到了,多数的基于日志文件的Web使用挖掘推荐系统都存在一个冷开始的问题,即当一个新的页面被加入网站中还未被任何用户访问过,则推荐系统不能将其推荐。这样我们就可以利用页面聚类的方法,可以将被访问过的页面进行聚类,然后对新页面归类,具体的实现可以用到矩阵聚类[12]。同时针对于用户进行相应的聚类分析,一类用户对应于一类的网站页面。对于某一新用户访问完网站后,可以根据其浏览的路径,将其归类,待下次其访问网站的时候可以推荐相应类内页面。

由于用户浏览页面时通常是带有目的性的,但可能带有多个目的,所以在浏览页面的过程中不同目的可能重叠交织,而不同的目的页面之间的访问顺序不是我们所关注的。假如用户同一时间段内访问A、B、C、D,访问A、B是为一个目的,而访问C、D又为另一个目的,则A、B与C、D的访问序列并不能反映出用户的访问意向,这就需要通过页面聚类将这些子会话事务区别开来,从而提高了页面推荐的精确度。

4 实现

图3

整个推荐模型分成两个部分:离线的数据准备部分和在线的推荐部分。离线的数据准备部分又分为两种方法:一是根据客户的浏览行为将客户模糊聚类分析;二是从日志文件中挖掘出频繁访问路径。在线部分也分为两部分:一是根据客户当前访问序列,在频繁访问路径集内找到这些访问序列的推荐集,然后由Web服务器把这些推荐集的超连接发送到客户的浏览器供客户参考使用;二是此用户的登录时,查看用户的所属分类,将属于这个分类的推荐集的超连接法送到客户的浏览器上。

5 结束语

Web挖掘的结果对于商家在电子商务环境下分析客户的行为、调整网站的结构以及进行商业决策有着重要的意义。本文集中在对Web使用记录的挖掘上,对数据的预处理工作做了一定的补充,结合网站中各页面的链接结构信息细化了用户的会话,并且通过用户的访问路径对用户进行聚类,并将挖掘的结果用于路径的预测推荐和新用户的归类。下一步的工作是如何提高页面推荐的精确度。同时,Web数据具有很强的时效敏感特性,在以后的Web挖掘研究中我们还要考虑到Web数据的实效度问题,这样可以让决策者去掉冗余或过期的信息,做出更符合时势发展的决策。

参考文献:

[1] D Cheung, J Han, C Y Wong. Maintenance of discovered association rules in large databases:An incremental updating technique. Stanley Y, W Su. Proceedings of the twelfth International Conference on Data Engineering(ICDE’96), New Orleans, Louisiana, IEEE, Computer Society, 1996:106-1140.

[2] SARWAR BM, KARYPIS G, KonSTAN J, et al. Analysis of recommender algorithms for e-commerce[A].Proceedings of the 2nd ACM Ecommerce Conference(EC’00)[C] . Minneapolis, 2000: 135-141.

[3] Herlock J, Borchers A et al. An algorithmic framework for performing collaborative filtering[C].In: Proc of the Conference on Research and Development in Information Retrieval, ACM, 1999:230-237.

[4] RESNICK P, IACOVOU N, SUCHAK M, et al. GroupLens: an open architecture for collaborative filtering of netnews[A]. Proceedings of the Conference on Computer Supported Cooperative Work[C]. Chapel Hill, NC, 1994:185-186.

[5] SHARDANAND U, MAES P. Social information filtering: algorithms for automating “word of mouth”[A]. In Proceedings of the ACM CHI Conference(CHI95)[C], 1995.

[6] Badrul M, Sarwar, George Karypis, et al. Analysis of Recommendation Algorithms for Ecommerce[A]. ACM Conference of Electronic Commerce [C].New York::ACM Press, 2000:158-167.

[7] LANG K. Newsreader: learning to filter news’[A]. Proceedings of the 12th International Conference on Machine Learning[C], 1995. 331-339.

[8] 於惠文,周兴社.电视节目个性化服务技术的研究[J].小型微型计算机系统,2005.26(1):105-110.

[9] 詹宇斌,殷建平.一种基于有向树挖掘Web日志中对大频繁访问模式的方法[J].计算机应用,2006.26(7):1662-1665.

[10] 崔林,王辉.基于网络内容和结构数据的用户浏览模型[J].河南科技大学学报(自然科学版),2005.26(6):59-61.

[11] COOLEY R. MOBASHER B, SRIVASTAVA J. Data Preparation for Mining World Wide Web Browsing Patterns[J]. Knowledge and Information System. 1999.1(1):5-23.

以上就是小编为大家整理的关于个性化推荐(精选5篇)的全部内容,更多个性化 精选 推荐相关文章请持续关注360范文网!(本文共字)

菁英职教网文章归档 教育资讯 留学攻略 七品教育网站地图xml
331975