信息计量视角下的网站健康度检查*——以河南省市级政府门户网站为例

2011-03-10 05:55苏芳荔
图书馆学刊 2011年2期
关键词:门户网站搜索引擎市级

苏芳荔

(郑州航空工业管理学院信息科学系,河南 郑州 450015)

近年来,期间我国政府网站建设成效显著,截至2009年底,我国政府域名(GOV.CN)注册量达到49730个[1]。数量如此庞大的网站,质量却参差不齐,因此网站健康度检查(Website Health Check)这一概念便被提出。网络信息计量方法在网站健康度检查中得到了广泛应用,尤其是链接分析法,能够从结构角度对网站健康度作出判断,并为网站设计提供建议。

河南省的电子政务发展和政府网站建设在国内一直处于中等水平,2010年1月国务院信息办发布的《2009年中国政府网站绩效评估报告》显示,2009年河南省在省级政府网站绩效得分排名中居第18位,在地市级政府网站绩效得分排名中仅有6个城市居前100位[2]。笔者将以河南省所辖18个市级政府的门户网站为对象进行健康度检查测评,以期能够掌握各地市政府门户网站的建设现状,认清发展中存在的问题和不足,为日后网站的优化和完善提供依据。

1 网站健康度检查概述

国外专门的网站健康度研究处于起步阶段,相关内容及提法散见于论文案例和部分工具之中。国内对于网站健康度的研究也只局限于网站评价中,有一部分工具能够针对网站健康度检查进行优化,但总的来说,仍没有形成一个完整的理论体系。网站健康度的确切内涵是什么,目前也没有一个正式的定义,但大致可以从以下几个角度来理解。

1.1 网络影响力

网络影响力(Web Impact)是网站健康度的一项重要指标,主要体现在网络链接方面。网络链接的作用是组织网络信息,表达其间的关系。“入链数”可以作为评价网站网络影响力的指标[3]。M.Thelwall在《LinkAnalysis:An Information Science Approach》一书中对西班牙的64所大学网站进行了健康度检查,他从链接的角度进行分析,度量的指标包括:网站规模、网站入链数、网站出链数、网站指向的顶级域名分布等[4]。

网络影响力的另一体现是网络流量(Network traffic)指标。可以从3个方面来度量网络流量:①访问人数,指在某一时刻或时间段中,浏览该网站的人数;②网站访问量,指该网站一段时间内被用户访问的总的页面数[5];③人均访问页面数,指每个用户在一次访问时间内所浏览或获取的该网站的网页数。

1.2 网站可见度

网站可见度(Website visibility)是网站健康度的另一个重要指标,它是指特定网站中的信息被搜索引擎获取和索引的数量,一般以页面数作为计量单位[6]。根据《第25次中国互联网络发展状况统计报告》显示,目前3.84亿网民中使用搜索引擎的比例是73.3%。由此可见,网站对于搜索引擎是否可见,可见度高低,都直接影响着它的使用率,因此,网站可见度也成为网站健康度的一项重要指标。

1.3 网站权威度

网站权威度(Page Strength)可理解为网站的重要性值、信任级别或者强度。PR值(PageRank)是一个典型的网站权威度指标,它可以反映一个网站被Google引擎收录的状况。一般来说,具有较高PR值的网站会有较高的健康度。但PR值不是网站权威度的唯一指标,SEOmoz开发出一个测量网站权威度的工具,即trifecta,它能给出网站一个分数,这个分数代表了网站的重要性和流行度[7]。

2 河南省市级政府门户网站健康度检查

2.1 研究对象与方法

笔者选择河南省所辖18个市级政府门户网站作为研究对象。本案例使用的主要工具和方法有:使用搜索引擎AltaVista获取网站总链接数;使用Alexa工具检查网站的流量指标和排名;选择Google和百度两大搜索引擎检查网站相应的可见度指标;使用Google PR值来测度网站的权威度。

表1 河南省市级政府门户网站

2.2 研究结果

2.2.1 网络影响力

①链接指标

在搜索引擎AltaVista中,使用“link:www.***.gov.cn”语句获得18个市级政府门户网站的总链接数,结果如图1所示。总链接数是评价网站网络影响力的重要指标。郑州市、洛阳市、信阳市和安阳市在该指标中居于前4的位置,表明这4个市级政府门户网站在链接指标上拥有较大的关注度和影响力。许昌市、周口市和平顶山市在这个指标上则表现不佳,这表明它们的业务宣传和网络影响力还不够好。

图1 Alta Vista获取的市级政府门户网站总链接数

②流量指标

Alxea提供全球范围内权威的网站流量查询,图2和图3分别是18个市级政府门户网站日均IP访问量、日均页面浏览量(PV)指标周均示意图。郑州市、济源市和鹤壁市居于日均IP访问量的前3位,处于日均PV浏览量前4位的网站为郑州市、洛阳市、新乡市和南阳市。根据表2的Alxea排名可以看出,郑州、洛阳和南阳这3个门户网站的排名靠前。从这些结果可以看出,郑州、洛阳、南阳的几个门户网站比较能吸引大家的注意。而济源和鹤壁虽然IP访问量靠前,但排名和页面浏览量都不占优势,表明用户对这些网站都是匆匆浏览,不能吸引大家进行更细致的了解和访问。

图2 市级政府门户网站日均IP访问量(周均)

图3 市级政府门户网站日均PV浏览量(周均)

表2 18个门户网站的Alxea排名

2.2.2 网站可见度

使用“限定要搜索指定的网站”选项,分别获取各网站被百度和Google收录的页面数。图4给出了18个门户网站在Google和百度两大搜索引擎中的可见度。三门峡市和安阳市门户网站在Google中拥有绝对优势的可见度,焦作市、三门峡市、郑州市和信阳市在百度中拥有绝对优势的可见度,这表明这些网站的搜索引擎利用效率较高,其影响力也必然较高,因而具有良好的健康度。驻马店和商丘市在网站可见度指标中表现不佳。

同时,由于搜索引擎本身算法的差异,同一个网站在不同搜索引擎中也有不同的可见度。百度所能获取到的网站网页数要远远大于Google。

图4 18个门户网站在两大搜索引擎中的可见度

2.2.3 网站权威度

我们这里使用PR值来测定网站的权威度,18个门户网站的PR值如图5所示。其中郑州市、安阳市、南阳市、信阳市和济源市的PR值为7;其他门户网站的PR值均为6,焦作没有测出。

图5 18个门户网站的PR值

3 结论和存在的问题

河南省电子政务建设已经初具规模,广域骨干传输网络已连接到18个省辖市,省直城域网络基本建成并得到较好应用。21个纵向业务系统依托省电子政务网向下延伸,省直单位电子政务外网接入率已达85%。18个省辖市政府、90%的省直单位和87%的县级政府开通了门户网站[8]。但是,本研究结果显示,多数市级政府门户网站影响力极低,网站健康度检查结果不尽如人意。这表明政府部门存在重网站建设而轻利用的现象,这是对资源的极大浪费,应引起有关部门和领导的高度重视。

基于网站健康度检查的网络测评还存在以下问题:

①缺乏成熟的理论指导。网络计量学是在上世纪90年代中后期逐步形成的一门学科,对其研究不过10多年的时间。相比非网络的传统信息的生产、传播和利用规律的研究已经取得大量成果,网络信息在形式、数量、手段、内容等各方面与非网络信息都存在极大的差异,因而,难以直接借鉴和使用已有研究成果。

②缺少完善的研究工具。笔者所作的分析都是基于商业搜索引擎的,但是,商业搜索引擎不像SCI那样是专门为引用分析而设计和开发的,被用于网络计量学分析时,存在着覆盖率低和稳定性差等缺陷。

③研究工具功能不完善。虽然AltaVista、Google、AllTheWeb等少数搜索引擎提供了类似link、domain、host等指令,可以利用这些功能对简单的网络链接关系进行分析,但对于聚类等复杂的链接现象仍缺乏有效的工具。

④数据获取存在不确定性。网络数据呈动态分布,这种不断变化着的网络信息内容,使得研究中所获取的网络数据反映的只能是某一时刻的情况,增加了研究结果的不确定性。

4 河南省市级政府网站建设的建议

如何设计网站才能保证网站具有较高的健康度?这是进行网站健康度检查的出发点和根本目的所在。一般来说,网站设计拥有固定的原则,这是保证网站健康度的基础;从网络信息计量学角度来说,网站的链接结构对网站健康度意义重大,所以这也是必须要考虑的。

4.1 关键字策略

在关键字的选择上要注意以下几点:①从用户角度出发选择关键字;②需要对核心关键字进行扩充和重复排列,保证网站对用户的可见度;③避免使用涵义太宽泛的关键字,否则用户可能会迷失在数量庞大的网页信息中而找不到所需内容,降低网站原有内容对用户的可见度;④确定合适的网页关键字数量。

4.2 链接策略

影响搜索引擎排名的一个重要因素是网站的导入链接,搜索引擎认为,如果网站质量较高,就会吸引更多的入链,而吸引的入链越多,则网站质量越高。另外,需要注意垃圾链接问题,搜索引擎仅对高质量的外部链接予以重视。

4.3 信息构建

信息构建技术并不是针对网站健康度设计而提出的,但它在网站设计方面的理念,能够有效地提高网站健康度。Rosenreld和Morvile对信息构建进行了详细的解释:①信息构建是在信息系统内组织、标识与导航规划的结合。②信息构建是对信息空间的结构化设计,以方便任务完成和直接获取内容。③信息构建是对网站和企业内联网进行结构化和分类以帮助人们查找与管理信息的艺术和科学。④信息构建是集中应用设计科学和建筑科学之原理的新生科学和实践领域[9]。

[1]中国互联网络信息中心.第25次中国互联网络发展状况统计报告,2010.

[2]2009中国政府网站绩效评估报告[EB/OL].[2010-07-09].http://www.echinagov.com/gov/special/special36/page1.html.

[3]Almind,T.C.,Ingwersen,P.Information analysis on the world wide web:methodological approaches to“web metrics”[J].Journal of Document,1997(4):404-426.

[4]Thelwall,M.Link Analysis:an information science approach[M].New York:Elsevier,2004:119-134.

[5]王伟军.电子商务网站评价研究与应用分析[J].情报科学,2006(6):641-642.

[6]刘伟,段宇锋.基于网络影响力的电子政务建设绩效评价[J].情报科学,2006(11):1705-1706.

[7]SEOmoz’s Page Strength tool[EB/OL].[2010-07-09].http://www.seomoz.org/trifecta.

[8]河南省电子政务发展规划(2009-2012年)[EB/OL].[2010-07-09].http://www.drcnet.com.cn/DRCnet.common.web/DocViewSummary.aspx?docid=1978005&leafid=3090.

[9]潘梅.国内外信息构建(IA)研究综述[J].图书情报工作,2004(6):8-12.

猜你喜欢
门户网站搜索引擎市级
宝应县泾河镇创成市级“侨之家”
县域经济发展市级统筹篇
市级自然资源信息化建设探讨
市级电视新闻报道中同期声使用的技巧
YouTube
网络搜索引擎亟待规范
基于Nutch的医疗搜索引擎的研究与开发
基于Lucene搜索引擎的研究
中国省级教育门户网站排行榜等
搜索引擎,不止有百度与谷歌