中国教育和科研计算机网
EDU首页 |  中国教育 |   高校科技 |   教育信息化 |   CERNET
教育信息化

资讯 | 专题 会议 观点 专栏 访谈 企业 产品 CIO 技术 校园信息化 下一代互联网 IPv6视频课堂

中国教育网 > 教育信息化
您现在的位置: EDU首页 > 教育信息化 > 集成应用 > 基础应用 > 搜索系统
哈工大教授刘挺:下一代搜索处于模糊边界
http://www.edu.cn   2009-06-08 作者:唐宏梅

字体选择:【大】 【中】 【小】

  在哈工大信息检索研究室主任、国家863“中文处理”重点项目总体组专家刘挺看来,很难讲什么是下一代,智能搜索仍处于模糊边界,不过有些特征与技术上的趋势已经显现出来。

  尽管对于下一代搜索技术有诸多表述与说法,但在哈工大信息检索研究室主任、国家863“中文处理”重点项目总体组专家刘挺看来,很难讲什么是下一代,智能搜索仍处于模糊边界,不过有些特征与技术上的趋势已经显现出来。

  个性化检索呼之欲出

  在互联网搜索领域曾经做过这样一个测试,当把搜索页面的Logo标志掩盖住,同时在几大互联网搜索工具中键入关键词进行搜索时,结果时Google所搜索出的结果最令人满意的。在互联网搜索技术领域,以Google为代表的关键词搜索已经足够饱和。

  “基于关键词的大搜索已经发展得差不多了”,刘挺认为,这时候,个性化检索便呼之欲出。目前,当人们进行关键词搜索时,不同的人键入同一个关键词所获取的结果是完全一样的,个性化搜索可以按搜索者所在地域、以往搜索历史等综合因素,通过跟踪检索等工具猜测检索者所想要的。


  比如同样输入一个关键词“苹果”,有的人希望找的是苹果公司的产品,有的人希望获取的是关于水果的一些信息。

  当然,对于要不要个性化仍存在争议,比如,当检索者同样介入“新浪”时,结果都是一样,而无需个性化。不过个性化还将为目前互联网搜索领域的商业模式起到一定的助推作用,当搜索技术足够个性化,对于跟踪检索足够成熟的时候,个性化广告便由此变得

  非常有价值。比如一个想购买房产的网友,当搜索技术猜测到其真实想法时,便能精准地将房产相关的信息及广告递送给需要的人。

  刘挺认为,目前,个性化检索技术在算法上不是太难,但这种检索对于计算机本身的要求很高。随着目前云计算等相关技术的发展,个性化检索也会大势所趋。

  问答系统:向简洁看齐

  根据CNNIC最新的调查报告显示,目前,网友对现在搜索结果不满意的占到总体的35%,40%的用户会在第一次键入关键词的基础上重新进行修正,72%的用户认为搜索结果非常凌乱。在互联网海量信息中,简洁明了寻找到自己想要的,而不受其他干扰,这同样得看搜索技术对检索者想法的臆测。

  哈工大教授刘挺分析,目前我们看到的检索结果都是“参考文献”的方式,而并不是把答案给你,这是现有搜索技术最大的问题。

  现有搜索技术中,已经有这样的方式对“垃圾”信息进行初级的人为摒除,比如“百度知道”,当一个人提问之后,经过令一个人或者多个人的回答找到自己所需信息。另一方面,各大厂商也在致力于实现真正“人机对话”,以PowerSet和WolframAlpha为代表的问答式精准搜索近来收到普遍的关注。这一检索的最大特点是足够简洁明了。

  移动搜索不是简单的PC应用移植

  而随着手机上网资费的逐步下降,3G大规模商用,移动终端的应用愈渐丰富完善,诸如UCWeb将网页做到足够漂亮简洁,许多搜索厂商开始与电信运营商以及移动终端提供商捆绑式合作,在移动终端预装其搜索工具。就在微软刚推出的搜索工具bing(必应)当天,微软MSN副总裁刘振宇便对外表示,目前已经与中国电信展开移动搜索等方面的合作。

  然而,在哈工大教授刘挺看来,移动搜索并不是简单的将PC上的搜索应用简单移植。“它(移动搜索)有特定的检索需求,要求特别精准,与检索者所处的位置息息相关”,同时,刘挺认为,移动搜索的应用更多是生活类的搜索。

  搜索社区化商务化

  点击付费或者竞价排名,自1997年搜索领域兴起以来,各大厂商均沿用这样的商业运营模式,这使得诸如垂直搜索网站因为用户群过小而一直处于狭缝中生存。搜索商业模式的创新成为目前各大厂商关注的话题。

  一方面,搜索因为海量数据挖掘使得其显得无所不能,另一方面也因为搜索技术的无处不在而对传统领域冲击损害到其他商业利益群体。诸如前几年全球几大唱片公司状告百度的非法下载,到如今各大唱片公司对互联网的传播方式得到改观并期望通过互联网分得一杯羹。于是有了传统唱片公司与搜索厂商的合作,为用户提供免费正版音乐。互联网无处不在的触角让其商业模式也打破以往传统方式,开始走向合纵连横。

  刘挺认为,随着SNS的快速崛起,搜索与互联网社区的资源整合将有可能带来创新的商业模式。比如通过facebook上相互熟悉人的口口相传,让互联网广告变得更加具有可信度与公信力。

  此外,搜索领域一直在探讨语音搜索等智能方式,刘挺认为语音搜索主要在于语音识别与语音合成,虽然目前语音合成技术已经成熟,但语义识别会因为噪音等干扰还难以实用。

  来源:比特网

页面功能 【打印】 【关闭】 【我有话说

MOOC风暴来袭

版权所有:中国教育和科研计算机网网络中心 CERNIC,CERNET,京ICP备15006448号-16,京网文[2017]10376-1180号

关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@staff.cernet.com