《旅游大数据研究》审读报告

2019-03-04 13:22
传播与版权 2019年12期
关键词:斜体副教授大写

王 建

(中国经济出版社有限公司,北京 100011)

一、书稿的整体评价

随着人们生活水平的提升,旅游热开始出现,致使旅游行业积累了大量有价值的数据,如果能加以挖掘和梳理,应该可以从中发现行业发展的规律,指导该行业更好地发展。可惜的是,市场上大数据主题的图书很多,但与旅游业有关的较少。因为旅游大数据的研究需要具备旅游和计算机两个领域的知识,而这样的作者比较难找。

黎巎副教授是中国科学院软件研究所的博士,大数据就是其专业领域。而目前黎副教授供职于北京联合大学旅游学院,对旅游行业研究较深,她的研究领域为旅游客流仿真建模、旅游大数据分析与挖掘、信息技术的旅游应用。

除此之外,黎副教授还担任国家智慧旅游重点实验室副主任,以及国内外著名旅游学术期刊的审稿专家。所以,由黎副教授来撰写一本与旅游有关的大数据专著,再合适不过。

作为国内市场中比较少见的涉及旅游大数据的专著,《旅游大数据研究》一书多少具有一些奠基性和开创性。因为本书为后续研究者提供了一个旅游大数据研究的体系架构,便于后来者以此为基础继续深入研究。

在这本专著中,黎副教授首先对旅游大数据的概念进行了界定;在此基础上,从旅游文本大数据、游客移动大数据、游客搜索大数据、旅游大数据标准四个方面进行了深入研究,并介绍了所用的研究框架、方法和案例等,所选内容和案例比较切合实际,有一定指导意义。对于后来者来说,本书比较全面地介绍了旅游大数据研究的主流工具及其使用方法,以及作者自己整理的两个规范性文件——《文化旅游资源兴趣点(POI)及道路采集规范》《文化旅游资源数据描述规范》。结合上述内容,本书可以说将旅游大数据的研究带入了体系化、规范化、工具化的轨道中。

二、编辑加工的详细内容

书稿的总体质量不错,内容比较全面,结构较为完整。但细节性的小问题较多,有些段落行文不太流畅,意思表达不够清楚,这些问题需要作者根据编辑的提示加以处理。有些细节问题由编辑在正文中直接修改,比如两项的乘积数值错误,公式中字母的大小写和正斜体误用,英文单词首字母大写不统一,国家部委的名称未更新等。有些细节问题的修改需要与作者沟通,以防编辑曲解作者原意。

(一)编辑直接修改的细节性问题

有些问题,编辑认为在自己的能力范围之内,直接加以修改,当然也需要作者最终加以审核。

1.层级不清。某些阿拉伯数字后面,有时是标题,有时是句子。为此,特地重新设置全稿的层级为5个:第一层级是章名,作为标题放入目录;第二层级是节名,作为标题放入目录;第三层级,使用汉字数字“一”,作为标题,但不放入目录;第四层级,使用汉字数字“(一)”,作为标题但不放入目录;第五层级,使用阿拉伯数字“1”,作为标题但不放入目录。

2.英文单词拼写不规范,或者缩写词与原词不符。正文中出现的英文单词,首字母有时大写,有时小写,需要统一成首字母大写的形式。比如:“Computing community consortium”应该为“Computing Community Consortium”。缩写词与原词不符,比如“用户创造内容(User-Created Content,UCG)”,应该为“用户创造内容(User-Created Content ,UCC)”。

3.使用某些已经不存在的国家部委的名称。对于2018年国务院机构改革中不再保留的部委的名称,使用时需要加上“原”字。比如“环保部、国土资源部、国家林业局、农业部”,应该改为“原环保部、原国土资源部、原国家林业局、原农业部”。

4.有些著名组织的英文名字拼写有误。比如“世界经济合作与发展组织(The Organisation for Economic Co-operation and Development,OECD)”,应该为“世界经济合作与发展组织(Organization for Economic Co-operation and Development,OECD)”。

5.出现错别字。比如“从而按照区域晒选”中的“晒选”,应该为“筛选”;比如“本书选取正负情感预料各2000篇”中的“预料”,应该为“语料”。

6.两项数字的乘积有误。比如“语料至527页,每页20条短评,共计11323条评论”,527与20的乘积应该为10540,而不是11323。

7.公式中的字母拼写形式有误。在一个公式中,同一个字母同时出现了大小写和正斜体形式。比如下面的公式:

式中,p(Cj)中的Cj,大写和小写两种形式同时出现,且其正体和斜体也是两种形式同时出现,需要统一为大写和斜体。改后的公式应该为:

8.表序重复出现。比如“表2-1”重复出现,经排查,把第二个改为“表2-2”。

9.图形中的文字出现压线问题。原图如下:

修改后的图形如下:

10.图中曲线多于1条时,没有标明各条曲线的名称。比如如下的原图:

经修改后,变为:

11.段落中句子的层次不清楚。比如:“首先能够对连续词序列进行合理切分;接着能够将每个分词结果标注为相应的词性;可以分析出句子中包含的语法结构并进行相应标注的同时能够识别并判读词语在所包含句子中承担的语义角色即施事者还是受事者等。”按照该句子的句意和标点符号(出现分号)推测,出现的问题有:“首先”之后应该是“其次”和“最后”;部分句子的主语缺失;最后一句话的句子有些长,该断句的地方没有断开。修改后的句子变为:“首先,LTP能够对连续词序列进行合理切分;其次,它能够将每个分词结果标注为相应的词性;最后,它可以分析出句子中包含的语法结构并进行相应标注,同时能够识别并判读词语在所包含句子中承担的语义角色,即施事者还是受事者等。”

(二)与作者沟通后修改的内容

由于书稿涉及旅游与大数据两个行业,很多内容编辑把握不准。所以,编辑常常通过微信和电子邮件与黎副教授沟通,向其请教。有时为了一个问题,黎副教授会花费较长时间重新查阅资料。

1.书名号是否该加。比如“中国游客满意度调查展示了国内游客满意度……”,该句话明显表述有问题,通过与黎副教授沟通,得知“中国游客满意度调查”是一个调查报告,故本句话最终改为“《中国游客满意度调查》展示了国内游客满意度……”。

2.有些表述无从下手修改。比如“互联网行、点击、查询等行为数据”,该句话明显句意不通,遂在批示中指出这一点,最后黎副教授修改为“互联网浏览、点击、查询等行为数据”。

3.对于变量的探讨。比如下面的公式中的“idf(t)”,对于中间的“d”是变量还是微分符号很难看直观分辨清楚;并且,如果“d”是微分符号的话,还需要把它改为正体。与黎副教授沟通后得知,“idf”是一个不可分割的整体,还是个变量名,需要写成斜体形式。

4.数字类表格中出现短横线。数字类表格中出现短横线“-”,这是不规范的用法。因为在规范的图表中,只会出现空白或一字线“—”。其中,“空白”表示无此项;“—”表示未发现。在与黎副教授讲明规则后,由其选择规范的用法。

(三)编辑修改失误的地方

在修改正文过程中,编辑难免会曲解句意。比如“通过数据预处理,基于LDA的主题分类,最终给出三大网站的故宫游客评论的主题类别”这句话,编辑在“通过数据预处理”后面加上了“方式”两字,变成了“通过数据预处理方式”;但黎副教授指出预处理是一个步骤,不是一个方式,需要把误加上的“方式”两字删除。

三、后续问题

对于“(一)编辑直接修改的细节性问题”中的内容,编辑虽然感觉修改正确,但难免有失误之处,需要复审、终审进行把关,尤其是涉及公式和计算机程序方面的内容,还需要复审仔细审核。

猜你喜欢
斜体副教授大写
投稿须知
高鹏副教授
张燕副教授
做一个大写的“我”
大写的厉害:“00后”少年自制火箭成功上天
丁莺作品选登
你不是“生”而为父母,而是“学”而为父母。
“大写”与“大些”
《海南医学》斜体的使用说明(一)
—个大写的pink 该入手的都来了