admin 管理员组

文章数量: 1184232


2024年3月10日发(作者:如何使用clone指令)

第3O卷第l0期 

情报杂志 

2011年10月 

JOURNAL OF INTELLIGENCE 

Vo1.30 

No.10 

0ct. 

2011 

社会化标注系统中基于社区标签云 

的个性化推荐研究木 

曾子明 张 振 

(武汉大学信息管理学院武汉

摘要

430072) 

社会化标注系统中,标签是用户对资源进行标注的结果体现,标签的出现使得原有的<用户,资源>二元组 

变成了<用户,标签,资源>三元组,我们在研究了已有的个性化推荐模型的基础上,提出一种基于社区标签云的个性 

化推荐模型。该模型对社会化标注系统中的用户、资源分别聚类形成社区,得到代表每个社区的标签云,然后进行 

标签云之间的相似性计算,从而产生个性化推荐。最后通过实验证实该方法不但提高推荐的查全率,而且使推荐的 

内容更具有多样性。 

关键词社会化标注社区标签云 个性化推荐聚类 

中图分类号TP311 文献标识码A 文章编号】002—1965(2011)10—0128—06 

A Personalized Recommendation Approach Based on Community 

Tag Cloud in Social Tagging System 

ZENG Ziming ZHANG Zhen 

(School of Information Management,Wuhan University,Wuhan 430072) 

Abstract In social tagging systems。tags are results of users annotations.The appearance of the tags changes the two way user-item ma- 

trices into three dimensional user—tag—item-which brings the recommender systems development chances into a new direction.Recom— 

mender systems have been utilizing tags for identifying similr aresources and generate personalized recommendations.In this paper we pro- 

pose a personalized recommendation approach based on community tag clouds.The proposed approach is realized in two aspects.Firstly, 

we cluster items into communities based on analyzing the tags annotated by users,at he stame time,we can lso clauster users into commu— 

nities based on analyzing the tags hey have uttilized,and then we give every community a tag cloud.Secondly,we calculate he sitmilarity 

between the item s community tag cloud and user's community tag cloud to make personalized recommendation.The results of empiicalr e— 

valuation indicate the supefiofity of he approach itn improving the precision and diversity of the recommendations. 

Key words socil taagging system community tag cloud personalized recommendation clustering 

0引 言 

随着互联网的迅猛发展,尤其是Web2.0的出现, 

用户不再是被动的网页浏览者,而是成为了主动的参 

与者,以致越来越多的信息呈现在用户面前,造成信息 

注的热点问题 。个性化推荐正是解决这个问题的一 

种有效方式,从根本上说,推荐就是代替用户评估他从 

未接触过的资源 ,这些资源可以是书、电影、音乐、网 

页、饭店、甚至可以是社会标注系统中的人以及标签 

爆炸,出现了信息超载现象。如何让用户从浩如烟海 

的信息中找出自己感兴趣的信息,同时让有价值的信 

息被需要的用户享用,一直是相关学术界和企业界关 

收稿日期:2011—05—04 修回日期:2011—06—27 

等。近年来,学术界提出了许多基于Web2.0环境下 

的个性化推荐方法,作为Web2.0环境下用户生成内 

容的典型应用一一社会化标注系统,它不仅允许用户 

对其所关注的资源进行关键字标识,以方便个人信息 

基金项目:教育部人文社会科学青年项目“新一代电子商务搜索引擎的信息聚合和可视化建模研究”(编号:08JC870011);中国博士后科学基 

金项目“面向用户的电子商务搜索引擎信息聚合和可视化建模研究”(编号:20090460988);武汉大学自主科研项目(人文社会科学)(编号: 

09ZZKY096)的研究成果之一。 

作者简介:曾子明(1977一),男,博士,副教授,研究方向:搜索引擎、推荐系统和信息服务等;张

系统、社会化标注系统。 

振(1987一),男,硕士研究生,研究方向:推荐 

第10期 曾子明,等:社会化标注系统中基于社区标签云的个性化推荐研究 ・129・ 

管理,而且为用户共享资源或观点提供了一个开放的 

社会化环境 ],Joshua Schachter是第一个提供社会化 

标注服务的,也就是现在的de1.icio.US网站,自此以后 

社会化标注得以迅速发展和广泛应用,出现了Hicl ̄、 

Youtobe、Last.fm、CiteUlike、Twitter等众多新的应用 

与体验。标注是人们对大量信息进行组织分类的重要 

手段,在很久之前就得到了应用特别是对于图书馆员、 

编目者和专业分类人员而言,只是其所用的标签是受 

控的,没有体现出社会性 。在社会化标注系统中,有 

三个主要要素:WEB用户、WEB资源和社会化标签。 

WEB用户对WEB资源进行标注,其标注的结果表示 

为标签。社会化标注系统的流行,源于它允许任意用 

户对任意资源标注任意标签,而且可以与其他用户共 

享这些标签。 

由于标注系统提供的简便易用的社会性协作机 

制,吸引了大量用户的参与,于是产生Folksonomy的 

社会性标签。标签作为一种特殊的元数据,来源于大 

众标注者对资源的主观感受的概括,同时被用户用于 

描述资源和对资源分类,和资源的关键字相比较而言, 

标签具有一定的灵活性,与用户个体相关,是个性化 

的,而且标签为无法显式表示为文本的项目提供了一 

种文本维度,在标签中往往蕴含了原文中没有直接表 

达的内容,将标签作为推荐技术的数据来源,能够研究 

出同时具备内容过滤与协同过滤优越性的个性化推荐 

的模型方法。文献[5]中R.Jaeschk借鉴了pagerank 

的方法提出了名为folkrank的方法,将用户、资源、标 

签作为节点,将标注关系作为边构造了一个网络计算 

用户、资源、标签的权重,对于每个资源获得相关标签 

的folkrank值,将权值最高的标签推荐给用户。文献 

[6]根据资源被标注的标签,来对资源进行分类,从而 

提高推荐的准确度。但这些研究主要考虑了标签与资 

源内容的关系,而忽略了标签与用户兴趣的关系。本 

论文中根据标签分别对用户、资源加以聚类形成社区, 

然后产生各个社区的标签云以及目标用户标签云,不 

但考虑到标签反映资源内容的特性,而且考虑到用户 

所用标签反映了用户兴趣的特性。从而提出基于社区 

标签云对用户进行个性化推荐的方法。 

1 基于标签的个性化推荐系统 

推荐系统主要有三个组成要素:推荐候选对象,用 

户和推荐方法。其目的是经过推荐算法从推荐候选对 

象中过滤出有价值的资源对象推荐给需要的用户。从 

而可知,推荐算法的好坏是推荐系统的成功与否的关 

键。推荐的目的是不但推荐与当前用户兴趣相关的评 

分较高的资源,而且还应该推荐与当前用户兴趣相近 

的用户评分较高的其他资源,如推荐列表中含有n个 

推荐资源,与当前用户兴趣一致的资源数r1,与当前用 

户兴趣相近的其他用户评分较高的资源数r:,有r,+r2 

=n,在该推荐列表中对于资源r(r∈r2)如果当前用户 

关注并且给予标注,则说明当前用户同样喜爱该类资 

源,应该更新其用户文件。这样能保证推荐的多样性, 

更大程度提高用户满意度。 

在社会化标注系统中,用户对资源添加的标签不 

但是对资源的描述,而且是对其自身兴趣爱好的描述。 

传统的评分方法是把用户对某一资源的喜好表示在对 

资源的评分上,如果资源不存在了,这种评分也相应的 

消失,在信息大爆炸,更新速度飞快的今天,旧的信息 

很快就被新信息取代,推荐不但要为用户找到其所需 

的资源,而且要在用户同等喜好下能够提供最新的资 

源,因此标注优于评分,而且逐渐成为信息标识的主要 

方式。另外,这些社会化标签的不同不但显示了资源 

之间的差异性,而且表示了用户兴趣偏好的差异,为利 

用标签形成资源/用户社区提供了条件,有助于进行社 

会化分类。<资源,用户,标签>这个三元组的关系可 

用图1表示。 

资源 标签 用户 

图1社会化标注元素关系 

在该图中我们可以看出,不同的用户可以对同一 

资源添加不同的标签,同一用户也可以对不同的资源 

添加相同的标签。可以用一个三元组<“,r,t>表示 

用户、资源、标签三者联系起来,如果用U={ ,,“:, 

u }表示WEB用户集合,R={r。,r ,…,rm f表示 

WEB资源集合,T={t ,t:,…,t }表示社会化标签集 

合,那么社会化标签系统模型D可以表示为:D=(u, 

R, ,A),其中A是 ,R, 之问的一个三元关系,A 

×R×T,对于M∈U,r∈R,t E T,0=(“,r,t)∈A稍; 

作一个标注,代表用户n用标签t标记了资源r川。通 

过资源、用户、标签三者之间紧密联系,可以看出在推 

荐的时候可以推荐资源也可以推荐标签,甚至可以推 

荐对该资源进行标注过的用户,无论是推荐三者之中 

的哪一个,当前用户都能够根据其中的一个找到另外 

两个,因此在本文的推荐模型中,我们在推荐资源列表 

中使用标签代表资源。 

2 社会化标注中基于社区标签云的个性化推荐 

2.1社会化标注系统中基于标签的聚类 在社会 

化标注系统中,用户和资源之间的关系靠标签来联系, 

130・ 情报杂志 第30卷 

用户u对资源r进行标注的同时也是对自己兴趣偏好 

的标注,标签同时被用户和资源拥有,也就是说当用户 

u用标签t标注资源r的同时,标签t也标注了用户u 

的兴趣偏好,所以就产生了用户个人标签集和资源标 

户所用标签相似度的度量是用户聚类的关键 。 

Diedefich 提出使用一个标签向量代表用户档案,向 

量中每个标签对应的元素值为用户使用该标签标注资 

源的次数。所以用户聚类分为两个步骤: 

a.计算用户标签的相似度产生最近邻居集 

., 、 .

签集,用户个人标签集合中的每个标签对应一类资源 

集合,由用户使用该标签标注过的资源组成。当向用 

户进行推荐时,就可以根据用户标签集t 和资源标签 

集t,的相似程度以及资源的受欢迎程度,作为推荐列 

表中资源质量高低排序的标准。在社会化标注系统 

一 

)・ ( ) 

ll (ru) V( )l l

: ! :! : 

( ) + (I )。+I (l1 ) 

r 1、 

) +"( ) +. (_c_ _) 

中,社会化标签的数量级别相当大,每个web用户和 

每个Web资源所涉及的只是其中很小的一部分,由此 

会引发严重的“数据稀疏性”问题 。如果把拥有相 

同或相似标签的用户和资源分别加以聚类,也就是根 

据相似度把兴趣偏好相近的用户划分为同一个社区 

中,并且给这类用户一个“社区标签集”,即社区标签 

云,这样就提高了整个社区的兴趣范围,而且解决了对 

某些标签稀疏的用户不易推荐的问题,例如在一个有 

n个用户的社区 中,/Z E U(i=1,2,…,n),用t 表 

示用户“ 的标签集,那么社区标签云T ,=t u t u… 

u t ,通过设定标签云中每个标签的字号大小以及颜 

色的不同来表示其“受欢迎”的程度,能够实现快速而 

自动的信息聚类,生成系列加权列表和标签云(Tag 

Cloud),直观性和易用性强,在进行资源推荐时有助于 

用户发现其潜在兴趣,避免资源推荐范围过窄。同样, 

对于大量的资源通过计算其相似度,把资源内容相近 

的资源集中在同一个社区中,根据资源内容对这类资 

源的众多标签进行内涵外延界定,忽略错误的、具有歧 

义的、无意义的标签,保留高质量的标签,然后产生这 

类资源的“社区标签集”,即资源社区标签云。标签聚 

类有助于实现标签的有序化组织、规范化表示,在进行 

用户一资源标签相似度度量时,可以度量标签云之间 

的相似度,从而对用户推荐与其兴趣相近的标签。这 

样不但解决了数据稀疏性问题,而且查全率更高,同时 

提高了推荐资源的多样性,也解决了现有推荐系统中 

用户规模、资源规模难以扩展的问题。 

2.1.1 基于用户标签相似性对用户聚类。基于 

用户相似性方法 的前提假设是相似的用户趋向于 

有相似的偏好。核心思想是将预测用户对资源的喜好 

问题转化为集成相似用户对待推荐资源的已有评价偏 

好的问题。由于用户的兴趣爱好及其使用的标签并非 

固定不变,所以对用户的社区的划分是一种无指导学 

习问题,可以采用自底向上的层次聚类和K均值聚 

类,其关键是找到一个度量类间距离的函数,,可以参考 

协同过滤推荐算法中的,利用用户的历史信息计算用 

户之间的相似性的方法。我们使用夹角余弦相似性 

(cosine similarity),在基于标签的用户聚类过程中,用 

(c__

..

其中, 代表用户 使用过的所有标签, (t 

代表用户u 使用过的标签n在用户所有使用过的标签 

集中的偏好度,基于“用户使用某个标签标注的资源 

越多,表明用户对该标签的兴趣度越高”这个前提。 

所以有: 

,r ):_.! : 一 f2 

∑countTagging(u ,后) 一 

E, 

对于设定好的阈值e,如果sim(Tu ,Tu )≥e,则 

把u 和 归入同一个用户社区,如果sim(Tu

, ,

)< 

e,则 和“ 不能在同一用户社区。由于用户兴趣的 

多样性,决定了用户浏览资源的不确定性,用户对资源 

标注时所使用的标签具有动态变化的特征,也就是说 

用户的兴趣和爱好是随时间变化而变化的,所以一个 

普遍采用的策略就是提前计算所有用户标签的相似性 

sim( 

, 

),每隔一个时间周期 进行一次更新,例 

如Grouplens系统 采用相似性数据库存储每个用户 

对的相似性,并且每隔24个小时更新一次用户对的相 

似性。我们考虑监测用户所用标签的变化程度,当变 

化程度超过预先设定的阈值 时,则重新计算该用户 

与其他用户的相似性。 

b.用户社区u标签云的产生:用 ,,代表用户社区 

的标签云, 代表用户u 所有使用过的标签集合,则 

有T =Tu u Tu,u…t.J 。 

2.1.2基于资源标签的相似性对资源聚类。在 

社会化标注系统中,用户的标注行为比较自由,所以针 

对同一资源不同的用户可能会添加不同的标签,但在 

不考虑恶意标注的情况下,这些标签语义上是相近的, 

而且对于同类的相关资源,它们被标注的标签也是语 

义上相近,因此基于标签的资源聚类的关键就是要计 

算这些标签的相似性,一种常用的方法就是根据标签 

的共现次数判定标签的相似性。基于标签的资源聚类 

也分为两个步骤: 

步骤1 根据标签共现计算标签的相似性 副 

资源集R:{r ,r ,…,r小),所有被标注在R上的 

标签的集合T: ,t 一,t )。n(r,t)表示标签t被 

第10期 曾子明,等:社会化标注系统中基于社区标签云的个性化推荐研究 ・131・ 

用来标注资源r的次数,用 ( )=∑n(r,f)表示标签 

t在资源集R上出现的次数,Ⅳ(r)=∑n(r,£)表示资 

源r被标注的次数。则有标签t。与t:相似性的算法可 

表示为: 

用基于内容的推荐算法对当前用户u 推荐标签云。 

用户组标签云和资源组标签云的余弦相似性算 

法: 

sim T( , )=—= ,i— 

“ l1 

l lI 1

T . 

(4) 

ll 

):∑q(t I r)Q(r It:) (3) 

其中, 是用户u 所在社区的标签云向量模 

 

在公式(3)中,g( r)= 譬表示标签tl标注 

型,

资源r的次数占资源r所有被标注次数的比例。 

是候选推荐资源社区的标签云向量模型, 

与 向量中的分量,根据其在标签云中出现的次数不 

Q(r  Ic2)=! 表示标签 标注资源r的次数占标 

同而具有不同的权重,常用的是在信息检索领域广泛 

地使用的TF—IDF计算方法¨ ,该方法中计算词项权 

签t 所有标注次数的比例。对于给定阈值e,如果 

P (t)≥e,则标签t 与t。可看为语义相似,被它们标注 

重的经典计算公式为: c.d=if,,d×i =tf,, ×log 。 

的资源也可以看作是同类资源,并归入同一个社区。 

其中t是文档d中的词项, . 是词项t在文档d中出现 

步骤2资源的标签云产生:对于同一个社区的 

的频率,idf,是词项t的逆文档频率, 是出现t的所 

资源R:{r。,r2,…, ),则该社区的标签云 =rr U 

有文档数目,与之类似,在我们的推荐系统中,对于标 

u…u ,其中 (1≤i≤n)表示资源r 拥有的 

签t与标签云tc,t在tc中的权重的计算公式可表示 

所有标签。 

为: 

2.1.3 目标用户社区的标签云。目标用户是指 

g ) 

对某特定资源感兴趣的用户,即特定资源的目标用户。 

在资源聚类完成的基础上,可以得到对特定资源组感 

其中n( ),n(tc),‘∑n( ),∑n(t∈ )依次代 

兴趣的目标用户,在当前用户访问该资源组时,可以为 

其推荐目标用户社区的标签云 ,当前用户可以根 

表标签t在tc出现的次数,所有标签云的个数,标签云 

据目标用户社区的标签云来决定是否浏览该社区中用 

tc中所有标签出现的次数和,出现标签t的所有标签 

户所用相关标签标注的资源。目标用户社区标签云的 

云的个数。综合考虑标签云之间的相似性程度和标签 

提出旨在实现推荐内容的多样性。 

云的重要性程度,我们对当前用户“ 推荐的资源社 

区的标签云列表ListT:{ ,, 2,.“, )的排序所 

2.2基于标签云的个性化推荐 协同过滤推荐和 

基于内容的推荐,是目前应用较为成熟的推荐技术,基 

使用的算法如公式(6)所示: 

于标签的推荐可以结合协同过滤和基于内容的算法来 

Rank( )=Asim(Tu一 )+(1一A)n( ), 

对当前用户U 进行个性化推荐,用 表示用户 

(i=1,2,…;A∈【0.1]) (6) 

u。 ,使用过的所有标签集合, ,表示对当前用户“ 

其中sim( r, 

, 

)代表用户社区标签云与资源 

根据2.1.1中公式(1)的相似性算法聚类后所形成的 

社区标签云的相似度;/2( 

)代表资源社区标签云 

用户社区, u

中的标签被使用的次数,是基于资源的重要程度与 

表示该用户社区的标签云。对用户 

“…的个性化推荐有以下两种方式。 

其被标注次数正相关而得出的;A∈【0.1】是可调参 

2.2.1 用户所在社区标签云的推荐。由于用户 

数,由公式(6)可知,A用来平衡相似性(A=1)与资 

“ ,所在社区的其他用户兴趣偏好与他自身比较接 

源重要性(A=0)。如果当前用户u 还没有加入任 

近,所以其他用户所使用的标签标注的资源可能也是 

何一个用户社区,则可以通过计算用户“ ,的所有使 

用户 ,比较感兴趣的资源。因此可以对“ ,推荐其 

用过的标签构成的标签集 

与资源社区标签云 

所在社区的标签云:T:{ ,

一 

},其中, £,代表 

的相似性即sim( ,Rr),代替sim(Tv , )。在当 

当前用户“。 所在社区标签云, 

代表当前用户 

前用户/Z 面对推荐资源列表上的推荐资源社区标签 

u。 ,的标签集,推荐列表中标签的排序方式按其使用 云时,如果u ,在浏览的过程中,使用了推荐的标签云 

次数降序排列。 

中的某一标签,则说明 ,对该标签标注的资源感兴 

2.2.2 基于标签云的相似性推荐。由于标签云 趣,我们可以把该类资源的目标用户社区标签云 ,. 

是由多个标签构成的,所以可以把标签云看作是一个 推荐给//,。 ,这就利用了协同过滤推荐资源多样性的 

文档,其包含的标签看作是文档中的词项,因此我们采 

优势。基于社区标签云的个性化推荐主要算法如下: 

132・ 情报杂志 第30卷 

算法:TR Rank() 

输入:用户使用过的标签、资源被标注的标签及标签的权重 

输出:排名TOP—K 

的资源社区标签云 

Init(T);Load(T); //对用户、资源的标签资源进行初始化, 

并加载标签权重向量 

Begin 

到U2的标签云 。使用2.1.2中基于标签相似性对 

资源聚类的算法,可知这四个资源分为两类:R1: 

{Requiem for a dream,Trainspotting}和R2={Star 

Trek,Die Hard},得到Rl的标签云T1’={drugs,ad 

diction,loneliness,depressing,psychology,social 

commentary,black comedy,dark comedy},同样的方 

//用户Uj的标签集Tu for eachTui do 

{ 

式可得到R2的标签云T2’。当对用户Tom进行资源 

Getw(tu。 ); 

重 

//根据公式2计算用户标签集中标签的权 

’ 

推荐时,根据2.2.1中的推荐算法,可得到Tom的推 

荐标签列表TT。 =T1一uT。 

T={addiction,depressing, 

Getsim(Tui

Tu ); //根据公式1计算任意两个用户标签 

psychology,social commentary,loneliness,true story 

集的相似度 

if sim(Tui

Tui)≥e //判断相似度和阈值的大小关系 

GetCor ̄nunityTu(Tui.Tuj);//拥有相似标签的用户组成社 

区,他们各自标签集的并集构成社区标签云Tu 

} 

if Change(Tui)>degreea //判断用户所用标签的变化程度 

是否超过阈值O/ 

UpdateCormnunity Tu(Tu。

Tuj);//当用户兴趣变化程度超过 

时,对社区更新 

ofr eachtd,t’rj do //资源ri被标注的标签t,r_j被标注的标签 

t’ 

Getp ,(t); //根据公式3计算标签t和t’的语义相似度 

if P .(t)≥e //判断相似度和阈值的大小关系 

GetCommunityTR(t ,t’ ); //被相似语义的标签所标注的 

资源构成资源社区,相似语义的标签共同构成资源社区标签云 

ofr eachTu,TR do 

 {

Getsim(Tu,TR); //根据公式4计算用户社区标签云与资 

源社区标签云的相似度 

GetRank(TR); //根据公式6计算推荐的资源社区标签 

云列表 

Output(Rank(TR),TOP—K); //输出推荐的资源社区标签 

云列表 

nd 

3实验及结果分析 

为了更好地理解这个推荐的过程,我们使用一个 

简单的例子来加以描述。在这例子中有五个用户和每 

个用户所使用过的标签以及次数,见表1;有四个电影 

资源和每个资源拥有的标签以及被同一标签标注的次 

数,见表2。 

使用2.1.1中基于标签对用户聚类的算法,可知 

这五个用户可以分为两类:U1:{Tom,Jim,Rock}和 

U2={Crystal,Desert},而且可知u1的标签云T1= 

{drugs,addiction,depressing,psychology,social corn— 

mentary,black comedy,based on a book,crime,ac— 

tion,multiple storyline,loneliness,true story,histori- 

cal,mafia.corruption,gangster},同样的方式也能得 

historical,mafia,corruption,based on a book};根 

据2.2.2中的推荐算法,用户Tom得到的推荐资源标 

签列表TT。 ={drugs,addiction,loneliness,depressing 

psychology,socila commentary,black comedy, 

dark comedy}。另外,对于不在u1用户组的其他用 

户组来说,当对资源组R1感兴趣时,可以得到的目标 

用户所在组的标签云即T1={drugs,addiction,de— 

pressing,psychology,social commentary,black come— 

dy,based on a book,crime,action,multiple storyline, 

loneliness,true story,historical,mafia,corruption, 

gangster}。对于推荐的标签,通过标签查询,用户可以 

很容易地找到相应的被该标签标注的资源。这种推荐 

算法与现有的协同过滤推荐和基于内容的推荐相比, 

其推荐列表中的资源更具有多样性,更容易发现用户 

的潜在需求。 

表1用户及其标箨 

用户名 使用的标签及次数(次) 

l。nl 

action(4),multiple storyline(2) 

Crystal action(27),adventure(26), li。“ (20)・ 仰。。ph。ri (2O), p 。 

hero(20),violence【1,) 

. 

addiction(36),depressing(30),drugs(27),psychology(16),SO一 

cia1 c0mmentary(7),lonelfness(4) 

Desen action(17),n 附 (15), pace(14),rum (12), 。hi。。 

(11),alternate reality(6) 

。 17

),

an 州 ¨ ' 

( ),

10 cor

 

ruption 7 

(), 

gangster 4 

()

 

表2资源及其标签 

资源名 被标注的标签及次数(次) 

Requiem tor drugs【4 ,,addiction L4U J,loneliness j,aepressrng ), 

a dream psychology(6),social COlYd'/lentary(3) 

star 

( 

1 5 

). 

a dv e ntu re

(1),

3 vi

 

ol enc

e 5 () 

一. 

addiction(40),drags(39),black comedy(20),social corn— 

I nsp。 nng 

mentary(8),dark comedy(5) 

。 ill

DieHard 

is(35),hu一 ∽, 咖 

( 

10 

), 

based on a book 10 

( )

 

4结束语 

在社会标注系统中标签是用户和资源相互连接的 

第10期 曾子明,等:社会化标注系统中基于社区标签云的个性化推荐研究 

Berlin:Springer—Verlag。2007.506—514 

・133・ 

桥梁,通过推荐标签,用户就能够找到相应的资源。在 

这种基于社区标签云的个性化推荐方法中,我们根据 

用户使用过的标签来对用户进行聚类,产生用户社区 

标签云;根据资源被标注过的标签对资源聚类产生资 

源社区标签云。在对用户进行资源推荐时,只需比较 

用户社区标签云和资源社区标签云之间的相似性。另 

外,对用户也可以推荐其所在社区的标签云中他本身 

没使用过的标签;而且当用户表示对某一资源感兴趣 

时,还可以对其推荐该资源的目标用户所在社区的标 

签云。这样不但降低了推荐算法中相似性计算的时间 

[6] Chen H,Dumais S.Bringing Order to the Web:Automatically 

Categorizing Search Results[C].Proceedings of the SIGCHI 

conference on Human factors in computing systems,pages 145 

152,2000. 

[7]Hotho A,J Schke R,Schrriftz C,et a1.BibSonomy:A Socila 

Bookmark and Publication Sharing System C].Citeseer,2006 

『8] 易 明,操玉杰等.社社会化标签系统中基于密度聚类的 

Web用户兴趣建模方法[J].情报学报,2011,30(1):37-43 

[9] Shardanand,Maes.Social Information Filtering:Algorihms ftor 

Automating“word of mouth”[c J.In Proceedings of the 1 995 

ACM Conference on Human Factors in Computing Systems.New 

复杂度,同时提高的推荐内容的宽度。 

York:ACM.1995.2 10_217 

仅仅根据经验数据,从理论上论证文中提出的基 

[10]Breese,Heckermart,Kadie.Empirical Analysis of Predictive A1一 

于社区标签云的推荐算法的优越性,而没有对该推荐 

gorithms for Collaborative Filtering[C].In Proceedings of the 

算法和其他推荐算法的推荐结果作对比分析,是本文 

14th Conference on Uncertainty in Artificila Intelligence.San 

的不足之处。另外由于用户兴趣随时间变化而变化, 

Francisco:Morgan Kaufmann Publishers,1 998.43—52 

用户社区是一个变化的社区,如何构建用户兴趣变化 

[11]Haveliwala T H,Gionis A,Klein D,et a1.Evaluating Strategies 

for Similarity Search on the Web[C].Proc of 1lth International 

模型,也是本文所欠缺的地方。随着社会化标注系统 

Conference off World Wide Web,2002:432—442 

的越来越广泛的应用,用户的标注行为以及标注时所 

[12]Diederich,Iofciu.Finding Communities of Practice from User 

使用的标签会越来越规范,基于标签的个性化推荐也 

rPofiles Based on Folksonomies[c].In Proceedings of the 1 st 

会得到更多的重视,其他的推荐算法模型也将会层出 

International Workshop on Building Technology Enhanced 

不穷,这些推荐算法模型如何进行商业利用,以及不同 

Learning solutions for Communities of rPactice.2006:213 

的行业该对这些推荐算法模型该如何选择,将是进一 

[13]Konstan J A,Miller B N,Maltz D,et a1.GroupLens:Applying 

Collaborative Filtering to Usenet News[J .Communications of 

步研究的内容。 

hte ACM,1997,40(3):77—87 

参考文献 

[14]Wartena C,Bmsse R,Wibbels M.Using Tag Co—occurrence for 

Recommendation[C].2009 Ninth International Confemce on 

邹剑.基于标签的个性化信息推荐问题研究[D].天津:南 

Intelligent Systems Design and Applicantions.IEEE,2009:273— 

开大学,2009:4 

278 

[2] 

Resnick P,lakovou N,Sushak M,et a1.GroupLens:An Open 

[15]Wartena C,Brassee R.Instnace—based Mapping between The— 

Architecture for Coilaborative Filtering of Netnews『C 1.Proc 

sauri and Folksonomies[c J. In International Semantic Web 

1994 Computer Supported Cooperative Work Conf,Chapel Hil1 

Conference,ser.Lecture Notes in Computer Science,A.P.Sh— 

1994:175—186 

eth,S.Staab,M.Dean,M.Paolucci,D.Maynard,T.W. 

[3] 吴克文,朱庆华等.社会化标注系统中标签检索质量模拟研 

Finin,and K.Thirunarayan,Eds.,vo1.5318.Springer,2008: 

究[J].情报学报,2011,30(1):29—36 

356-370 

[4] 

魏建良,朱庆华.基于社会化标注的个性化推荐研究进展 

[16]Dumais S.Improving the Retrieval of Information from External 

[J].情报学报,2010,29(4):625—633 

So1.lfees[J].Behavior Research Methods,Instruments,and 

[5] 

Jaeschke,Marinho,Hotho,et a1.Tag Recommendations in Folk— 

Computers,1991,23(2):229-236. 

sonomies[C].In Proceedings of the 1lth European Conference 

(责编:白燕琼) 

on Principles and Practice of Knowledge Discovery in Databases. 

(上接第111页) 

Management Methods[J].European Management Journal,2005, 

tool[J].R&D Management,1996,26(3):213—229 

23(3):263—273 

[8] Balasubramiam R,mmrit T.Support Collaborative Proeess 

Klas Eric Soderquist.Organising Knowledge Management and 

nKowledge Management in New Product Development Teams 

Dissemination in New Product Development:Lessons From 12 

[J].Decision Suppo ̄Systems,1999(15):152—163 

Global Corporations[J].Long Range Planning,2006,39(5): 

[9]Hoopes D G,Posrtel S.Sharde Knowldege“glitches”,and rPod— 

497-523 

uct Development Performance[J].Strategic Management Joum— 

Hsing Hung Chen,He-Yau Kang,Xiaoqiang Xing,et a1.De— 

al,1999,20(9):835—865 

veloping New Products With Knowledge Management Methods 

[1O]Yang J,Yu L.Electronic New Product Development:a Concep 

nad Process Development Management in a Network[J].Com- 

tual Framework[J].Industrila Managent and Data Systems, puters in Industry,2008,59(2):242—253 

2002,102:14 

曹霞,喻登科.科技成果转化知识管理绩效评价体系构建 

[1 1]Martin Hoegl,Anja Schulze.How to Support Knowldege Creation 

_J].科技进步与对策,2010(9):128-131 

in New Product Development:an Invesitgation of Knowledge 

(责编:刘武英J 


本文标签: 标签 用户 资源