推荐鞫题酶爵候,尽警避免为肇令磊户撼荐过多戆翔题或者
为信誉度不高的用户推荐紧急的问题.
图1 邸时交嚣式问答系统流程图
Fig。1 Workflow of instant
user-interactive question answering system
本问答系统按照如下的流程运作.酋先,服务器端开始运 络。当蔡震户A骞疑阕需要髂答爵,该鬻声逶蓬客产嫡登人 问答系统,与此同时,他的所有历史评价信息以及操作信息被 读取出来,通过用户管理分析模块学习该用户的负载熊力及 其在务领域静兴趣度秘权威度,劳将其状态修改鸯在线。当该 用户掇出闯题Q以后,闯题管理分析模块粥会分析该阅题优 先级,并将其插入到问题优先队列中.随糟系统运行,问题调 度模块会将队列巾的问题逐一读取并依据用户模型将其推荐 至合逶的在线曩l≯.当该随憨Q被戎费推荐至臻户嚣懿露,嚣 会在被推荐的问题列表中发现该问题,如果他不愿意阐答,则 点击拒绝按钮即可,如果愿意阐答该问题,他便可以点击回答 按镪遴过客户端冬矗建立起秘涎交浚塞疆,将答案撵供绘A。 如果A登出系统戒者8在规定时间内没有回答Q或者A对 占所掇供的答案不满意,那么Q将从B的问题列表中删除;
反之,如果回答完毕,左可以关翅该阕题势通过评价系统以此
次交流巾对嚣的评分提交至阏答系统。在推荐的嗣时,本系 统还允许用户自己浏览所有朱被解决的问题并自行寻找问题 进行回答.
4系统模块算法设计
本节将首先介绍问题管瑚分析模块中问题的管理策略、
l霹麓鹅特征搓述方法以及转髹掏取算法.褥后奔绍臻户管理
分析模块中所采用的用户建模技术.最后介绍问题调度模块 所采用的问题推荐算法,以展泳本系统在推荐问题以及调动 震户参慧积极性时的效票。
4.1阏题管理分析模块
税本系统中。所有等待解决的问题都由问题管理分析模
稼注a;在譬孛出瑷豹羧搴.
以口 )一< %I,V魄 ,⋯。l,n)
J
t=lOcc(a^,g)2
4.2用户管理分析模块
<昭2’)
块统一蟹理.该模块通过维护一个闯题优先级队列将所有未 被褥决静闻题蔹照其优先级捺廖,以保诿囊要阕题优先推荐
的策略,同时,利用特征向量抽取算法将每~个问题映射到标 注向量窟闻中.其中,每一个标注代表一个知识领域,这样通 过标注澎量就毙爱跌渡阕题所涉及魏知识领域。
4.1.1问题优先级队列 用户提交的问题将首先送歪问题管理分析模块并依照其
撬先级自动捶入到阔题优先级驮歹lJ艘巾等待被绥决;当提
瓣者认必所提阕联融被解决时,剃将就闯鼷从队列中删除。随 着系统运行,该队列中的问题将按照其优先级被逐一取出送 至问题调度模块以推荐至合适用户处。此外。该队列要求任意
翔题的优先缀努矮犬予零,鹭黎随瑟静娩先缓小子零辩,它涛
从该队列中删除.下面给出了队列中问题优先级的计算公式:
Priority(q)=疆,溅,(91)+一c魏t x翮,!mpfo)rt燃anc.e(施q‘)磊夏西<1) 其中End(q)表示问题q的截鬣时间,Current为当前时间,单 位为“小时”,end(留)-Current为q的剩余有效期,表永该问
题懿紧急程度;霆Number(g)袭瑟对鼋酶接荐惩罚系数,越多
的用户被同时推荐了譬,则R Number(碍)越犬,此外,q被推荐 失败的次数越多,则R Number(窜)越大;Importance(g)表示q 的重要程度,该值为区闯【0,5】巾的一个整数,通常出提问者 给出,Importance(譬)越大表瞬阏题q越重簧;a力影响因子, 在本文中a=0.2.最后计算得出的Priority(鼋)即为问题巧 的优先级,该值越犬则q将越晕被推荐.
鑫攘荐时,翔暴Current邑经超毒end(譬),表暖该嗣戆已 经失效,则Priority(q)将变为负值导致q从PQ中删除.当q 被推荐后,R Number(窜)增加1。如果q被拒绝回答或者在规 定时闼砖未被成功鳃答时,那么R Number(譬)减少1。越辨,
当某丽户登出时,融被推荐至该耀户的所有问题R Number 也将减少1,并且从PQ中删除该用户提出的所有问题,此外, 该队列巾问题的优先级将实时更新,以保证户Q的质最。
4。1,2陵题耱征轴驭箕法 当问题从优先级队列中取出准备进行推荐时,系统需要
分析该问题所涉及的知识领域。以保证将其推荐至对该领域
感兴趣戆矮户处逡褥霉答.本文剃瘸领域标注集A一{a;,
吃,码,⋯,a。}表=;j专所有的知识领域,其巾q表示一个领域
本模块负责篮测用户的注册、登入叛及登撼等操作并维 护一个在线糟户列表UL=l群;,魄,u3,⋯,‰}用戳管理所 有在线用户。以便进行问题推荐,其中uj表示一个用户.当菜
用户鳓登入时,便将该用户插入至抛,并寻找朱被解决的问
题推荐至uj;耋磁登窭时,羹l萼簪其获滋孛裂狳.魏外,奉模块
采用用户模型抽取技术从每位在线用户的历史操作信息中分 析出他们的知识背景、兴趣爱好以及正作能力等信息.下丽酋 先给基用户模型的定义瑷及获取该模墅所器要蹋到鳇尾产历 嶷操作信怠.丽后猫述了用户模型的学习算法.
用户模型表示为溉元组<A,观。InterestA£,,Author. 饥F,Capability秽>,其中A为领域标注集;UL为在线用户 集;Interest^秽隽大夺麟幸辩的震产兴糯矩阵,毛梵InterestA静巾 第(_『,i)个元索,表示用户uj对予标注a。所对应的知识领域 的兴趣度;AuthorityA£,为大小m幸n的用户权威矩阵,%为A珈 thoritYAu中第(歹,i)个元素,表示用户魄对于标滋嘞翁对应的 翔识领域的权威度;Capability£r={Cl,c2,⋯,‰}秀m维懿 用户负载能力向量,cf袭示用户蜥搿前的负载能力.
本文通过用户uj楣关的问题集QR(uj)、Q敝(uj)、QRC (uj)、ORe(uj)、秽(uj)、QFC(uj)穰QFE(致)始舞建户uj懿 负载能力Ct以及他对a。领域的兴趣度“和权威度口旷其中. 辨(uj)表示曾经推荐麓用户“,并被操作过的所有问题,
剑竣<鳓)表承磐经推荐楚臻户酶但放抠笼的赝农翘题,QRC
(鳓)表示曾经推荐至用户鳓并被成功殡答的所有阕题,绺嚣
(uj)表示曾缀推荐至用户“,但没有在规定时间内成功解答 的所有问题;QF(均)表承用户嘞主动寻找并尝试回答的所肖 阉透,QFC(毪)表示臻疹酶主动强签并盈成功静新春阕麓, QFe(嘶)表示用户砷主动回答但惫失败的所有同题.由于系(责任编辑:南粤论文中心)转贴于南粤论文中心: http://www.nylw.net(南粤论文中心__代写代发论文_毕业论文带写_广州职称论文代发_广州论文网)