学术期刊投稿网站网页标记语言正确性之探讨
——以图书情报类期刊为例

2017-12-07 02:03
软件 2017年11期
关键词:正确性期刊论文网页

尹 楠

(南京晓庄学院 商学院,江苏 南京 211171)

学术期刊投稿网站网页标记语言正确性之探讨
——以图书情报类期刊为例

尹 楠

(南京晓庄学院 商学院,江苏 南京 211171)

本研究利用国际万维网联盟的网页标记检测工具检测学术期刊论文投稿网站的首页标记语言正确性和规范性。研究方法通过网页格式定义种类、网页错误数及网页错误类型三项指标。被检测的 19个学术期刊论文投稿网站的网页格式定义有两种:HTML 4.01 Transitional和XHTML 1.0 Transitional。学术期刊论文投稿网站首页标记语言的正确性检测通过率为0,部分期刊投稿网站的错误数较多,错误类型统计共有121种。研究结论认为期刊论文投稿网站整体的正确性检测就如同对期刊编辑出版工作的审视,学术期刊应将期刊论文投稿网站正确性的检测视为期刊管理业务之一。

学术期刊;投稿网站;网页标记语言

0 研究背景

当前,我国大多数的学术期刊都建立了论文投稿网站系统以方便作者投稿和专家审稿,期刊的编辑也可以应用网站系统对投稿作者的文章进行管理和审核,因此论文投稿网站系统的设计与维护非常重要。据Net Market Share 的数据,截止2015年7月,占据全球浏览器排行榜首位的仍然是 IE浏览器,总市场份额为 53.47%,Chrome浏览器位居第二位,最新市场份额27.66%,Firefox火狐浏览器以12%的市场份额位居第三位。由于各个网页浏览器对网页标记语言的解释与执行有一些差异,加上网页设计语言的多样化,可能会造成论文投稿作者使用的浏览器打不开网站的情况,即会出现网页设计语言与浏览器相互不兼容的情况出现。

设计的网页如果能遵守规范,就能确保网页架构与语法的正确性,也可以满足用户广泛浏览的需求。对论文投稿作者而言,遵守规范的网页能够减少投稿的困难度,让网页适用于更多的载体(移动端屏幕、电脑浏览器等),并减少错误信息的传递;对论文投稿网站的管理者而言,符合规范的网页较容易维护,因编辑团队可能随着时间的推移不断替换,对于新进人员而言容易了解及修改。另外,符合规范的网页也能够增进网页在网络上的可见度,提高搜寻引擎排名[2],使论文投稿作者更容易在网络上搜索到该投稿网站。

查阅中国知网、万方数据库等国内文献检索系统,发现目前国内并未有学者进行过相关的研究,查阅Web of Science、EBSCO等外文文献系统,发现国外学者对网页标记语言正确性检测方面的研究也较少,主要的研究有Chen等人[3](2005)利用网页检测工具了解网络上网页正确性的比例,并期望找出最常出现的错误类型。Chen等人的研究结果显示,有高达95%的网页不符合网页标准,并且不论使用何种网页样本搜集方式,前十大错误种类几乎完全一致。Breeding[4](2006)使用W3C的Markup Validation Service检测美国研究图书馆协会的 123个会员图书馆首页,进行网页正确性调查。研究结论显示,除了21所图书馆完全符合W3C的规范,其余均出现了错误,甚至有7所图书馆错误数达100个以上,错误率高达82%。

网页设计语言作为一种在网络上被广泛接受的计算机语言,是由国际万维网联盟(World Wide Web Consortium)所制定并规范化。关于网页设计语言方面的研究,目前众多学者进行了多角度的研究探讨[5-11]。网页设计语言不是一般的程序设计语言,而是一种网页标记语言(Markup Language),最为经典的网页标记语言 HTML 被称为超文本标记语言(Hyper Text Markup Language),其主要使用标记标签(markup tag)来描述网页。论文投稿网站的管理者可通过不同的检测工具(validator或checker)检测网页是否符合规范,如网页架构与语法的正确性可通过W3C(World Wide Web Consortium)的网页标记语言检测器(markup validator)进行相关检测。论文投稿网站网页架构与语法正确性与否会直接影响论文投稿服务的可访问性与正确性。因此,本研究期望通过 W3C网页标记语言检测工具的应用,检测我国论文投稿网站网页标记语言正确性(web markup language validation)程度及问题,并试图提出解决方法,以供论文投稿网站经营管理或建设发展作为参考。

1 网页标记语言正确性检测

1.1 研究工具

目前,网页检测工具较多,提供的检测功能也有所不同,能够进行各种浏览器的兼容性测试、负载测试,以及网页标记语言检测等。比较知名的网页检测工具有 Google web page tester、Browser Shots、IETester、Feed validator等。网页正确性检测是W3C Web Quality Tools中的功能,主要包括:(1)标记检测(MarkUp Validator),可用于检测网页上的各种常用的标记语言的规范性和正确性,如 HTML、CSS、XHTML、XML、WML 等;(2)Web内容的数据交换规范(Feed Validator),用于检测Atom或RSS feed语法的规范性和正确性;(3)层叠样式表检测(CSS Validator),用于检测内嵌在HTML、XHTML中的CSS样式的规范性和正确性;(4)超链接检测(Link Checker),用于检测网页中超链接(Link)和锚点(anchor)的规范性和正确性。

本研究主要使用 W3C提供的网页标记语言检测工具(MarkUp Validator),检测论文投稿网站上网页的各种常用的标记语言的规范性和正确性。通过该工具可以检测出受测网页的错误数(W3C网页标记规范性)、服务器种类、网页大小、网页格式、网页编码(GB-2312或其他)、文件类型等,并会列出错误之处及建议改进的方式。检测的方式除了可以直接输入网址外,也可以上传该网页的源代码进行检测。图1为网页标记语言检测的主界面,本研究主要采用输入统一资源定位符(URL)的方式进行网页检测。检测结果分成两部分;一部分是结果摘要,叙述错误数、警告数、编码(Encoding)及网页格式(Doctype)是什么版本等,如图2所示。另一部分则为检测出的错误或警告详细结果,并列出改正建议如图3所示。

1.2 研究样本

由于我国学术期刊的投稿网站较多,难以对所有的论文投稿网站的所有网页标记语言的正确性进行检测,因此本研究需要选择一定数量的样本进行检测工作。参考北京大学图书馆公布的2014版《中文核心期刊要目总览》,本研究选择其中列出的出版事业类12种期刊,以及图书馆事业、信息事业类的18种期刊进行研究(总计30种期刊),选择这些期刊作为研究样本的原因一方面是这些期刊均属于中文核心期刊,在网络上得到的关注度比普通的期刊高[12],一方面是出版类、图书情报类的期刊属于专门研究期刊编辑出版等问题的专业期刊,研究这些学术期刊建立的论文投稿网站网页标记语言的正确性和规范性具有一定的示范作用。

由于选取的 30种期刊中有部分期刊没有建立论文投稿网站系统,部分仅有 Email投稿方式,因此在研究中需要将这些期刊忽略,最终所选取的期刊如表1所示,有效样本为21个,取样日期为2016年4月5日。由于考虑首页为论文投稿作者首先打开的界面,其网页标记语法的正确性将首先影响到用户的操作,因此本研究将检测目标锁定在论文投稿系统网站的首页(Main Page),在网页标记语言检测的主界面中输入首页的统一资源定位符(URL)进行检测,并记录其检测结果。

2 检测结果的统计分析

本研究主要基于 W3C的网页标记语言检测工具,从网页格式定义种类(Doctype)、网页错误数及网页错误类型进行分析,从中了解学术期刊论文投稿网站在网页标记语言上的问题,以及提出建设参考意见。

在对有效选取的 21个期刊论文投稿网站首页进行检测的过程中,19个期刊的论文投稿网站能够正常进行检测,但有两个期刊论文投稿网站(大学图书馆学报、现代情报)的首页无法检测,其中大学图书馆学报的网站对检测进行了禁止设置(Forbidden),现代情报网站在检测中无法找到(Not Found)。

图1 网页标记语言检测的主界面Fig.1 The main interface for web markup language testing

图2 网页检测结果概要Fig. 2 Summary of web page testing results

图3 网页检测结果及错误警告说明Fig.3 Web page test results and error warning instructions

表1 有效选取的期刊列表及其论文投稿网站首页Tab.1 List of selected journals and homepage of paper submission websites

2.1 网页格式定义种类及网页错误数

网页格式如果没有定义,除了在内容呈现上可能出现错误,在数据交换及传输时可能也会出现问题,除了会造成数据的流失,有时还会导致错误信息的传递。对于论文投稿网站的网页格式定义类型,除了两个无法检测的期刊网站之外,其余19个期刊的论文投稿网站均对网页的格式进行了定义,包括两种 W3C定义标准,HTML 4.01 Transitional和XHTML 1.0 Transitional,具体的定义类型可见表2。

由表2可以看出,有6个学术期刊的论文投稿网站采用的是XHTML 1.0 Transitional的格式。相对于HTML 4.01 Transitional而言,XHTML标记语言,通过结合 XML和HTML的功能,使得网页内容更容易被手持移动设备以及电视媒体等访问。

对于网页错误数,被检测的19个期刊论文投稿网站首页的网页标记语言都出现了错误,出现错误数最少的是中国科技期刊研究和中国图书馆学报,部分期刊的网页标记语言错误数较多,如出版科学、情报科学、图书馆理论与实践。

2.2 网页错误类型

国际万维网联盟网页标记检测服务(W3C Markup Validation Service)给出定义的错误类型总共有447种(详见http://validator.w3.org/docs/errors.html#noverbose),本研究检测的19个期刊论文投稿网站的网页错误类型经过统计有121种错误类型,主要的错误原因在于标记属性使用错误或者未加定义。期刊论文投稿网站首页的前几项错误项目分别是 There is no attribute “……”(136 次)、Document type does not allow element “……” here(104 次)、Required attribute “……” not specified(91 次)及Element “……” undefined(85 次)。属性定义有误在信息的显示上可能不会出现问题,网页内容能够正常呈现,但对于数据的交换及传递会有一定程度地影响。在统计的 121种错误类型中,属于标签(Html-Tag)的错误数最多,说明期刊论文投稿网站的网页大多数为Html标签的定义或使用错误,因此在撰写Html语法时应注意标签的使用正确性。另外,由于网页制作软件的可视化和方便性,使得网页设计人员更容易的设计制作动态化的脚本语言,导致脚本(Script/Script-Tag)出错的数量也偏高。由于 19个期刊论文投稿网站网页的错误类型和数量较多,无法用表格的形式一一列出,图4为中国图书馆学报的检测结果,可以看出中国图书馆学报的论文投稿网站的网页没有出现标记使用属性方面的错误,仅有两条格式定义类型的错误。

3 研究结论及建议

本研究利用国际万维网联盟的网页标记检测工具检测学术期刊论文投稿网站的首页标记语言正确性和规范性,通过网页格式定义(Doctype)种类、网页错误数及网页错误类型三项指标,期望了解学术期刊论文投稿网站网页标记语言的正确性程度及问题,并提出网页错误的修正建议,以供论文投稿网站经营管理或建设发展作为参考。

表2 网页格式定义类型及网页错误数Tab.2 Web page format definition type and page error numbers

图4 中国图书馆学报网页检测输出结果Fig.4 Web page test output results of Journal of Library Science in China

在网页格式定义方面,由于不同的网页格式定义有可能导致信息呈现上的差异,甚至造成信息差错或遗失。本研究中被检测的19个学术期刊论文投稿网站的网页格式定义有两种:HTML 4.01 Transitional和 XHTML 1.0 Transitional,XHTML 1.0 Transitional格式结合了XML和HTML的功能,使得网页的包容性更强,因此采用XHTML 1.0 Transitional格式的网页更好一些,研究中发现采用XHTML 1.0 Transitional格式的期刊为编辑学报、中国科技期刊研究、情报学报、图书馆、图书馆理论与实践、情报杂志。在网页错误数量及类型方面,学术期刊论文投稿网站首页标记语言的正确性检测通过率为 0,部分期刊投稿网站的错误数较多。网页标记错误最少的期刊是中国科技期刊研究和中国图书馆学报。在网页错误类型方面,最常出现的错误类型为标记使用错误或未定义的属性(attribute),说明在建设期刊论文投稿网站的网页时,需要注意属性的使用。另外,在统计的121种错误类型中,属于标签(Html-Tag)的错误数最多,说明期刊论文投稿网站的网页大多数为Html标签的定义或使用错误,因此在撰写Html语法时应注意标签的使用正确性。

在研究中也发现网页标记的错误大多为网页语法与标签结构上的错误。在语法方面,开始结束的标签没有详细注明,例如有序列表标签始于

    标签,每个列表项始于
  1. 标签,标签的位置放置错误。在某些浏览器如IE可能会对不规范的标签进行自动调整和修正,但不能保证所有浏览器都可正常浏览。另外,如在有序列表标签中,省略了某一列的
    1. 也不符合网页标记语言的规范性。除了语法上的错误,网页结构也会出现错误,例如、与三者有规范顺序及位置,包含于中即不符合规范,可能会造成信息呈现上的问题。此外,如果出现Cannot continue because of previous errors错误信息,则可检查该行错误之前的网页语法是否有误。这些语法及结构错误,对数据交换及传递将产生一定程度的影响,降低信息的传递速度。

      由于网页格式定义未统一,及偏高的错误率,学术期刊论文投稿网站的网页标记语言正确性有相当大的改善空间。造成网页标记语言正确性低的原因,除了可能是网页制作人员不熟悉网页语法,网页制作软件无严格规范用户使用各对象及功能也是导致网页语法错误的因素之一。论文投稿网站是学术期刊面向论文作者提供服务的重要平台,网站内所有的网页均代表学术期刊服务的目标,因此期刊论文投稿网站整体的正确性检测就如同对期刊编辑出版工作的审视,学术期刊应将期刊论文投稿网站正确性的检测视为期刊管理业务之一,而网站正确性与投稿作者对期刊论文投稿网站服务满意度是否存在关联性,亦有必要进一步深入探讨,以作为学术期刊经营管理决策的参考。

      [1] Market Share[EB/OL]. 2015, http://marketshare.hitslink.com/browser-market-share.aspx.

      [2] [3]Chen, S., Hong, D., & Shen, V. Y. S. An experimental study on validation problems with existing HTML webpages[C].Proceedings of international conference on Internet computing,2005, 373-379.

      [4] Breeding, M. Web 2.0 ? Let's get to Web 1.0 first. Computers in Libraries[J]. 2006, 26(5), 30-34.

      [5] 潘小进, 林子禹, 张月强等. 语义Web的标记语言和体系结构[J]. 计算机工程, 2003, 29(5): 99-101.

      [6] 李超. HTML 5 中视频和音频核心事件的相关研究[J]. 软件, 2013, 34(7): 35-36.

      [7] 李强. 基于HTML5 的网页围棋游戏的开发[J]. 软件,2013, 34(9): 39-40.

      [8] 欧阳平凡. 三种动态网页语言ASP、JSP、PHP之比较[J]. 电脑知识与技术:学术交流, 2006(2): 124-125.

      [9] 周翔. 网页语言的自动选择[J]. 中国科技信息, 2005(20A):33-33.

      [10] 韩先培, 刘康, 赵军. 基于布局特征与语言特征的网页主要内容块发现[J]. 中文信息学报, 2008, 22(1): 15-21.

      [11] 李效东. 一种基于XML的Web页面定义语言[J]. 软件学报,2002, 13(1): 142-149.

      [12] 王术. 基于百度指数核心期刊影响后效应的分析[J]. 中国科技期刊研究, 2015, 26(1): 82-85.

      A Study on Markup Language Validations of Academic Journals Submission Websites

      YIN Nan
      (Business School, NanJing XiaoZhuang University, NanJing, China, 211171)

      This research Used W3C Markup Validation Service to validate the correctness and normative of the home page markup language of the academic journals submission websites. Through the three indicators: webpage formats (Doctype), the number of inaccurate webpage, and the error types of the websites. The webpage formats of validated 19 academic journals submission websites have two types: HTML 4.01 Transitional and XHTML 1.0 Transitional. All of the pages failed the test, some academic journals submission websites have high rate of inaccuracy, the statistical error types have a total of 121 kinds of types. Academic journals submission websites’ overall validations are like editing and publication of periodicals scrutiny, academic journals should regard the correctness validation of the websites as one of the tasks of the journal management..

      Academic journals; Submission websites; Markup language

      TP393

      A

      10.3969/j.issn.1003-6970.2017.11.034

      本文著录格式:尹楠. 学术期刊投稿网站网页标记语言正确性之探讨——以图书情报类期刊为例[J]. 软件,2017,38(11):181-186

      尹楠(1982-),男,汉族,江苏镇江人,管理学博士,南京晓庄学院商学院讲师,主要研究方向:管理信息系统、企业信息化。

      猜你喜欢
      正确性期刊论文网页
      一种基于系统稳定性和正确性的定位导航方法研究
      基于CSS的网页导航栏的设计
      基于URL和网页类型的网页信息采集研究
      浅谈如何提高水质检测结果准确性
      中文科技期刊论文LaTeX模板的研究与实践
      公共图书馆不应认可的职称期刊论文探析——基于重庆图书馆职称期刊论文的实证调研
      网页制作在英语教学中的应用
      人文社科期刊论文被引频次和下载频次相关性研究
      双口RAM读写正确性自动测试的有限状态机控制器设计方法
      10个必知的网页设计术语