信息过载引爆“相关性”角逐战

2011-03-25 08:51俞悦
中国计算机报 2011年10期
关键词:搜索引擎相关性网页

俞悦

曾经,AOL、雅虎站在互联网界的顶峰,但数年之后,它们却陷入了重组、裁员的泥潭中。在这些门户网站显露颓势之时,一支新力量迅速崛起,那就是搜索服务提供商谷歌。然而,市场不会念及旧情。如今,这位搜索巨头也遭遇了美国市场份额下滑、人才流失等问题。此时,更多采取众包方式、融入社交元素的服务开始成为市场的宠儿,最值得一提的便是近年市值疯长的Twitter。

虽然,上述企业看似在做不同的业务,但站在更高层面看,它们都在做同一件事——成为用户获取信息的渠道。从这些企业跌宕起伏的发展史中不难看出,用户获取信息的最终需求没有变,变的是技术和产业环境以及由此造成的信息传递渠道的改变。而在这场渠道变革中,“相关性”成为各企业角逐的重点。

谷歌搜索在阵痛中变革

“过去一两个月,我看到了很多关于谷歌搜索结果的负面消息,这是从未有过的现象。”近日,美国科技博客Search Engine Land的主编丹尼·苏利文(Danny Sullivan)表示。他提到的负面消息包括:一些科技博客、产业分析师和用户抱怨通过谷歌查找到的信息质量下降;哈佛商学院助理教授本·埃德尔曼(Ben Edelman)发表的有关谷歌“偏向性”的报告指出,谷歌故意将自家服务排在搜索结果的首位;数据分析公司Hitwise近期测试了几款搜索引擎的搜索成功率,结果显示,Bing的搜索成功率达到82%,而Google只有66%……

简而言之,这些负面消息都与搜索结果的质量相关,而这种现象的出现有其必然性。

众所周知,搜索引擎已经成为人们获取信息、进入其他网站的主要入口。正因为它的重要性,越来越多的企业为了让自己网站排名靠前,采取了许多“优化”手段。美国互联网内容制造商Demand Media就是其中的一个典型。

Demand Media的运作模式是,先找出关键词广告收费最高的搜索结果页面,然后聘请自由写手制作与这些搜索结果页面相关的内容,并将这些内容放在较好的域名中;之后,网站再利用搜索引擎优化技术突出这些内容;同时,在这些内容的一侧出售谷歌广告,以获得收益。

与Demand Media类似的企业被称为“内容农场”。有业内专家指出,内容农场提供的内容并不值得排那么靠前。这些网站没有很好地创作内容,而是通过搜索引擎来骗取流量,进而获得广告收益。

谷歌显然已经意识到内容农场对其搜索结果质量的损害。今年2月底,谷歌对搜索算法进行了调整。谷歌搜索工程师艾米特·辛格(Amit Singhal)和马特·卡茨(Matt Cutts)表示,这次算法更新的目的是降低低质量网站的排名,“这些网站给用户带来的价值较低,有的从其他网站抄袭内容,还有一些则提供不是很有用的内容”。

然而,谷歌需要做的不仅仅是清除内容农场。“谷歌目前需要解决搜索结果的相关性问题。” 广告巨头WPP旗下搜索广告公司GroupM Search的CEO克里斯·科普兰(Chris Copeland)指出。

的确,这是一个信息爆炸的时代,越来越多的无用信息充斥着网络,再加上用户访问互联网的方式、时间和地点也发生了变化,于是,越来越多的用户希望在搜索时能够更快速地得到更精准的答案。

实际上,谷歌一直在积极解决这种由产业环境变化引发的问题。

2008年,谷歌就已经开始根据用户地理位置以及其他多种因素,提供个性化的搜索结果。例如,如果用户持续访问某个网站,则在该用户后续的搜索活动中,该网站会出现在搜索结果页面靠前的位置上。此外,谷歌还一直在研究语义搜索。而就在今年3月初,谷歌又推出了一个新工具,以允许用户屏蔽搜索结果中特定的网站链接,以提高搜索结果质量。

产业环境的变革在促使谷歌不断改变的同时,也给其他搜索引擎企业带来了新的发展机遇。去年10月,搜索引擎Blekko抱着“清除网络垃圾”的目标正式上线。它提供了一系列搜索范围供用户选择。在一定范围里,用户仅能搜索到一些可信网站的信息。

从谷歌或是Blekko的做法来看,毫无疑问,它们都试图将自己的服务与用户的兴趣建立相关性,从而为用户传递更精确的信息。如今,这么做的企业并非只有搜索服务提供商。

众包模式日渐风行

“去年,StumbleUpon给内容网站带去的流量和Facebook带去的差不多。”一份来自Lijit(一家为网站提供用户行为分析与追踪工具的企业)的调查报告指出。

StumbleUpon是一个注册用户已达1400万的网页推荐网站。根据流量统计网站compete.com的数据,它在今年2月的独立访问量为320万,同比上升42.2%。3月10日,该网站还宣布已在B轮融资中募集1700万美元。

StumbleUpon能够得到市场的认可,缘于它采用了“兴趣图谱+众包”的模式。

用户登录StumbleUpon后先要选择感兴趣的内容类别,此后,用户每看一个由StumbleUpon推荐的网站,都能发现网页的上方有两个按钮——向上和向下翘着拇指的按钮,分别代表着喜欢和不喜欢。当用户点击向上翘着拇指的按钮时,则表达对推荐内容的喜爱, StumbleUpon将据此修正以后的推荐内容。这就是StumbleUpon力图建立起来的用户兴趣图谱。

而当用户选择喜欢或不喜欢时,实际上已经参加到了“众包”的运作模式中。这里所指的众包是,根据用户的推荐、喜好决定各种内容在StumbleUpon网站上的排序。换而言之,在一定程度上,越多用户推荐和喜欢的网页,排序就越靠前。

其实,很多提供信息的网站都或多或少地采用了“兴趣图谱”、“众包”等类似模式。比如,专门推荐娱乐内容和产品的网站GetGlue,它要求用户在注册后,先要选择喜欢的电影类型。之后,当用户登录网站,GetGlue会根据用户的喜好,推荐相关的电影等信息。用户点击电影后,可以选择喜欢或不喜欢,GetGlue则根据用户的选择来修正推荐内容。Hunch也是一个类似的网站,它先会询问用户十几个问题,然后依此为用户建立一个兴趣文档,并依据这一文档为用户推荐书、网页、餐馆等各种信息。

除了网页、新闻、产品等的信息推荐网站外,连问答网站都融入了众包模式。Quora就被定位为社交问答网站。它不仅可以提问和回答,而且能够接受浏览者对答案给予“支持”或“反对”的评价。一个答案的“支持”越多,答案的权重就越高,问题的质量也就随之提高,质量高的问题会更容易被用户获知。

杀手级方法是个传说

众包模式实际上是社交化的一种体现。像StumbleUpon、GetGlue等,这些服务本身都是以传递信息为目即作为一种媒体而建立起来的,社交元素只是促使信息更准确传递的一种手段。但是,在网络中还存在另一种模式,即本身作为社交网络而建立起来,却附带媒体属性的服务。最好的例子就是微博。

如今,微博已经成为人们获得信息的重要渠道。最近的日本地震就使微博的媒体属性展现得淋漓尽致。实际上,微博也是采用了众包方式——越多人转发,消息就越容易被人看到,消息的受关注度也会大大提高。

综观这些应用和服务,它们都在与用户行为建立相关性,只是采取的方式不同而已。但哪些方式更有利于建立相关性,目前还在探索中。至少,在网页推荐网站TrapIt的首席营销官亨利·诺斯哈福特看来,实现相关性没有杀手级方法。“杀手级方法只是传说。企业需要采用多种发现方法、过滤方法,同时使服务支持多种移动平台,这样才能让业务更具竞争优势。”

猜你喜欢
搜索引擎相关性网页
基于CSS的网页导航栏的设计
基于URL和网页类型的网页信息采集研究
小儿支气管哮喘与小儿肺炎支原体感染相关性分析
脑梗死与高同型半胱氨酸的相关性研究(2)
脑梗死与高同型半胱氨酸的相关性研究
网页制作在英语教学中的应用
网络搜索引擎亟待规范
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发
10个必知的网页设计术语