l篱介
互联阉的发展使得人们能够在互联网这个平台上方便的 保存数据、交流信息以及共享知识.现阶段,人们大多借助搜 索引擎获取所需知识.这种方式的效率并不高,因为农搜索 时,震声必缝透过一些孤立酶关键字描述掰髓信惠,致餐羧索 引擎无法准确理解用户的需求,只能返回若干与关键字相关 的信息,用户需要花火量时间从中寻找答案.因此我们提】出了 霜户交嚣式闻答技拳"’浚弥蛰搜索辱l擎静零是,该菝拳采耀 用户提闯用户回答的方式来满怒用户对知识的需求,用户得 到的答案通常非常准确.在该领域的研究中,计算机和甄联网 被当作一种辅助工更,用来提高用户的协作熊力和工作效率, 并帮勤耀户估计答察酶正确往。现如今,吾魔知道等交赢式闻 答系统融经为人们获取日常生活所需的知识提供了极为方便 的交流平台。但是逮嫂系统并束引入有效的问题调度机制来
将来解决的蝴题推荐至念适的用户处进行回答,雉以提高松
散酶用户群斡协作麓力襁工作效率,致使阕答的效率并不褒. 本文提出一种即时的、基于用户交互的问答系统设计方
察.该系统依照客户端/服务器(C/S)结构进行搭建,通过甄 黝模式解答人织箍窭酶瀚惩并裂攥阕题推荐税锲3|簪松散的壤 户群组织成为高效的协作网.该系统能够较好地理解用户对 柱个领域的兴趣度和权威性,并依照该信息推荐相关问题.嗣 黠。采用了调度技术【l’在保证拥有较嵩霞答率的翦提下,将 所有问题均匀缝推荐至不同用户处进行霞答,并且紧急的阏
题会被推荐至积极性较高的领域专家处,以确保问题能够被
及时回答. 接下来,蓄先介缨穗关领壤静研究情瑟,葱麓详缨描述新
提出的问答系统体系结构,最后展示原型系统以及问题推荐
效果.
收稿日期:2008-03-31收修改糯日期:2008-04.17基金矮匿:营家“九屯兰”重点基础研究发展计触基金项基(2003CB317002)资助;国家
自然科学撼金项目(60573077)资助;阁家“八六三”高技术研究发展计划基龛项目(2009AAOIZl32)资助. 作者简介:呼大为.男,1981年生,博
士研究生,主要研究方向为数据挖掘,信息抽取,自然语言理解以及问答系统等;陈恩红,教授,搏士生导师。主要研究方向为语义Web、数据挖搠
驳及鼹终馈患薤理等;刘文露,搏±。博士生等拜,塞要璎究方内势髑终欺诈检测、豳形识别、互联弼信怠处理、及交曼越答等。
2相关磷究工{童
实际上,所有的在线论坛都可被认为是一种交互式问答 系统,在这里用户可以随时提出问蹶并解答他人的疑问.但是 这些在线论坛仅仅提供?一个交流的平台,并泰对孚}持有酶 数据作任何分析,因此并不能通过分析用户特镁有效地将每 个用户联系起来,无法提高用户协同工作的能力.随着数据挖 掘、信息处理等技术的发展和应用,交互式闻答系统逐渐能够 簿摹的分耩掰户行为势为疆户提供蹙智能的鞭务。
在百度知道Bj、Yahoo!Answers",40等系统中,每当用户 掇出问题以艨,系统会自动查找与该问题相近且已被解决的 历史阕题势将缝键的答寨返霞终秀矮选答案之一。另外,当耀 卢回答某阐题时,若干与其相似且宥待解决的问题则会被摊 荐至该用户进行回答.显然,这种问题推荐机制熊够在一定程 度上调动用户参与度,掇寒了阔题的圆答率.露答瓷询”1则 禳据每位鼷声的历史撵作信患计算该用户懿信誉度j豫权威
度,用以自动评估该用户所提供答案的质量,辅助提问者在所 获得的答案巾进行选撵.另外,该系统弓1人了自动翻译模块, 裁够将闽题针对苓霾语攀争鳇震户迸褥对应静爨译,帮魏螯际 用户之间交流知识.但是,以上这些系统中,有的没有提供任 何问题推荐机制,有的仅向用户随机推荐若干与他所回答阅 题所属舨蕊搁嗣的问题,并没有根据闭题的有效期、薅户的知 谈结掏及积极性去设诗个性纯静推荐方案。因戴,这些系统并 不能够将现有用户群高效的组织起来,用户协作的效率不高. 缀然推荐机制很早就被掇出【6J,并柱电子商务¨删等领域憋 经发疆较长嚣雩阕,篷是疲耀爨闷答镁域时,这些方法并不÷分 衡效¨j.因此,本文提出一种即时的、基于用户交互的问答系 统设计方案,其中利用个性化的问题调度机制,将松散的用户 辩组织成为勰效的协作网,弥於了瑷有系统的不是。
3即时交氨式问答系统结构流程图
即时交纛式问答系统是采用C/S结构运作的,用户可以 裁溺该系统蔑翔舞答黠方提出的目越。圈l爱零T本系统的 结构流程图.如图所示,即时交互式l弼答系统主要由客户端母
服务器端两部分组成的.下面分别简要介绍这两个部分并举 例说明系统遮僚机制.
3.1系统客户鹾
客户端激要用以辅助用户便捷的管理个人信息以及进行 务种阔答操作.其中,个人信息的管理包括注册、登人/登出以 及令瞧纯设鼗等揉终.姿额藤户遂搿注耱嚣季,霹泼壤据喜好设 避敏感关键字,在以后的用户建模过程中,这些关键字将影响 系统对该用户兴趣领域的评估;问答操作包括问题以及答案 的提交帮测览.当尾户登入爨重,可以懿交蠡己的嬲惩、浏览其 他用户的阍艇以及查看新有被推荐的同题;登出时,他所提交 的问题将从系统删除.当用户想要回答某问题时,可以通过点 对点的方式与提问者即时交流,如果提闻者对该用户提供的 餐寨满意,酃么将关麓该润趣并将德设为簿驻辩决者。
3.2系统服务器端
服务器端主骚负责问题的维护及调度、用户管理以及用
户分析等操作.檄据功能的举同,服务器端又可分为暇个部 分:阏题管理分析模块、瘸户管疆分辑模块、|f霉题谲发模块戳 及历史数据库.其中,历史数据库存储了用户个人信息、评价
信息以及历史操作信息,包括:提问、回答以及拒绝回答等.问 题管理分析模块受责彗建采辫答鳇溺题势分辑这些瓣题麓摇 关领域.用户管理分析模块负责管理所有用户在(离)线状态 并依照历史数据库为所有在线用户建立用户模型,其中包含 用户兴趣度、信骜度、以及负载能力等倍感。受载能力表示该 用户掰以被同时推荐的闯题数目。同题调度模块嬲怒综合丽 户模型信息将所有未分配的问题按照其激瑟性逐一推荐至合 适用户处回答.为了保证被推荐的问题拥有较高的回答率,在(责任编辑:南粤论文中心)转贴于南粤论文中心: http://www.nylw.net(南粤论文中心__代写代发论文_毕业论文带写_广州职称论文代发_广州论文网)