Web2.0向Web3.0过渡下的网络信息资源组织发展

2019-03-07 05:22刘雨晴
电脑知识与技术 2019年36期
关键词:社会化分类资源

摘要:从Weh 2.0向Weh 3.0过渡的过程中,网络信息的组织是一个动态过程,而不是静态过程。面对庞大烦琐的网络信息资源,传统的人工组织方式已经不能满足网络信息资源组织的新要求。只有将各种传统的信息组织方法与新的网络信息组织方法相结合,才能提高网络信息组织的质量,搜索效率和信息利用率。通过大众分类法、网络信息自组织、知识组织和本体语义网的发展,网络信息资源组织将得到进一步的发展。

关键词:网络信息资源;weh2.0;web3.0;信息组织社会化媒体

中图分类号:TP391

文献标识码:A

文章编号:1009-3044(2019)36-0033-03

1面向社会化媒体的网络信息资源

1.1网络信息资源概念

网络信息资源以电子数据的形式在存储在非纸质印刷载体中的各种形式的信息,例如文本,图像,声音,动画,视频等,并且通过以下方式再现:网络通信,计算机或终端等方式。网络信息资源是计算机网络可以使用的各种信息资源的总和。[1]网络信息资源是电子化、数字化了的,并通过计算机网络进行传输、共享和利用的资源。

1.2社会化媒体概述

Web2.0的出现,不但使得因特网上的内容丰富,并且满足了与用户共同创新与分享的需求,形成了彼此沟通协作的社区。随着互联网技术的进一步发展,2006年一种新型的媒体形式:社会化媒体(Social Media)进入了人们的视野,加快了人类迈向信息社会的步伐,社会化媒体是一种给予用户极大参与空间的新型在线媒体,这是人们彼此共享想法,见解,经验和观点的工具和平台。[2]具有传统媒体并不具备的独有特性:公开性、参与性、共享性、交流性、联通性以及社区化特性,它模糊了时间和空间的界限,也模糊了媒体和受众之间的界限。用户被鼓励主动参与到社会化媒体的平台中,参与信息创建,交流,反馈,协作,贡献等,在没有任何障碍或限制的情况下加入和使用社交媒体,并轻松地形成一个社区以与、对共同感兴趣的信息内容进行交互。[3]而Web3.0是Web2.0技术的进一步发展,通过互联网与通讯的融合,用户可以用所有智能终端及时、轻松享受各种信息服务,在Web2.0的基础上,基于SPARQL(SimpleProtocol and RDF Query Language)、RDF(Resource DescriptionFramework)等标准,可以智能地使用各种数据库程序,这些数据库程序基于语义Web连接本体信息资源,并通过具有及时性,集成性和交互性的智能技术为用户提供个性化服务,Web3.0的技术核心是语义网技术。[4]

1.3面向社会化媒体的网络信息资源特点

1.3.1信息量基数大、增速快

大数据时代,我们无时无刻不面临着海量并且不断激增的数据,网络平台的开放性和自由性使得信息在发布时没有统一的标准。同时也缺乏宏观的管理,這就导致了信息数量的庞大、复杂并且排列无序。

1.3.2形式多样,分布广泛

内容丰富,形式多样,涵盖不同学科、领域、地域、语言,并且包括文本、图像、音频、视频等多种格式,除了结构化数据外,更多的是半结构化和非结构化的数据类型。网络信息的全球化分布,使得社会化媒体连接了世界的每一个角落,信息的分布也遍布不同国家、不同地区。

1.3.3网络信息流动加速

在面向社会化媒体的网络种,信息流的运动成为信息传递的主要形式,是信息资源的时空转移,并且在流动的过程中还会不断地产生与之相关的其他信息。在传统的网络信息资源中,信息的传递大部分是单向的,但面向社会化媒体的网络中信息的传递、接收和创造都是双向的,甚至是多向的,[5]网络主体可以不受时间和地域限制实现信息的交换和共享,信息流动速度也更迭迅速。

1.3.4个性化信息增多

面向社会化媒体的网络信息都是围绕用户产生的,每一个用户的信息组织体系都是个性化的存在,这也使用户在信息传递系统中是被动的,被动的接收信息。个性化信息的增多,会影响信息传递的过程,随着兴趣、关注热点、参与度以及需求的改变,会造成个性化信息的不确定性。那么信息的组织方式也会受到信息有序化程度的影响。

1.3.5版权问题复杂化

由于传统的信息资源大多是纸质的,而且大部分资源已经具有完善的版权保护制度以及法律法规,而在网络平台上的信息资源相关保护制度将更加复杂,且难以规定。

1.4面向社会化媒体的网络信息资源组织

在Web2.0和Web3.0的理念和技术应用环境下,网络信息资源组织的方式方法也分为面向用户、面向协作、社会化、面向机器理解几个方面。

在面向用户的信息组织中,比较有代表性的有博客,信息组织方法主要有:时间排序法、大众分类法、信息行为排序方法等。

在面向协作的信息组织中,比较有代表性的有维基百科,是通过协作的方式来创建、组织、维护信息资源。它具有如下特征:信息内容具有一定的编辑规则、信息行为具有一定的规范、信息内容不是一成不变,二是不断地更新和演进的。

社会化特征主要体现在用户对信息对象的处理行为上,例如在抖音中,用户浏览、下载、评论、搜索信息对象,赋予了信息资源本身社会化的特性,同时个性化的信息资源也增加了信息共享的需求和程度。

面向机器理解的信息组织与面向用户是相对的,HTML这类信息视图适合于用户理解,但不适合机器理解。XML是促成机器理解信息的基础,建立在XML基础上的各类协议(RSS、ATOM、OWL等)可以支持不同层次的机器理解,提高机器智能。[6]

2网络信息资源组织研究现状

2.1关于信息组织的技术

这方面的研究对象,主要是关于搜索引擎、元数据、数据挖掘、数据仓库、知识发现、标记语言、数据库技术、自动跟踪技术、机器翻译技术、信息检索的推拉技术、虚拟图书馆技术、专业指引库技术、智能代理技术、多媒体技术、人T智能技术等。武汉大学信息管理学院的晏凌与王应解基于联机分析挖掘技术(OLAM),提出了一种新的网络信息组织策略——智能化信息导航系统及其组织原则:空间暗示原则、用户原则、同一性原则及平衡原则。[7]李洪、隋利玲概括了三种多媒体信息组织和管理技术,即扩展现有的关系数据库模型,面向对象的数据模型,超文本和超媒体技术,介绍了“中国路桥多媒体数据库”的功能及其多媒体信息的组织管理方式。[8]

2.2关于社交媒体的信息组织

在对社交媒体信息组织的相关研究中,前人的工作分别在内容摘要、内容分类和聚类等不同的技术领域提出了相应的解决方案。

例如摘要(document summarization)[9]技术从数据压缩的角度来完成对海量信息的组织。其中,许多研究者通过从给定文档集中抽取出代表性的句子和可读性高的句子来为产品评论数据生成更为简短的摘要。而Yang等人[10]提出利用社交媒体之间的引用以及社交媒体用户的社交网络来提高微博摘要质量的方法。此外,如果给定一个已知的内容分类体系,我们也可以利用文档分类(document classiflcation)算法[11]将数据划分到不同的类别上去。

3网络信息资源组织的层次和实现方法

3.1传统网络信息组织方法

3.1.1分类组织法

分类组织方法是指网络分类组织方法。它首先对从网络获得的各个主题领域的信息资源进行标识和汇总,然后根据详细信息对它们进行分类和汇总,然后将信息整合到相同的字段中,然后再根据特定的顺序和规则来进行系统的索引编号。[12]分类组织法是从宏观的角度出发为用户揭示信息的内涵。

分类组织的方法是按总体轮廓对信息资源进行分类。这样可以清晰地组织复杂的信息资源,并允许用户从根据索引分类的类别中选择所需的信息资源。其优点主要体现在高搜索成功率和易学习的操作步骤,节省了管理成本、提高了检索效率。但是,分类组织方法仅适用于初步信息资源管理的建立,不同信息资源之间没有办法进行有效的联系。且面对信息时代的大量资源,这种方法有一些局限性,例如无法规范的描述信息资源的准确性,及时性,权威性等,用户只能在使用信息时自行判断。

3.1.2主题组织法

主题组织方法提供作者,标题,类名或关键词,标题词和其他形式来揭示和组织知识,用户可以在搜索关键词后获取相关的超链接。主题合成方法使信息的揭示更加直观,并允许根据信息的特征,结合信息手段本身的搜索手段,方便地搜索目标信息。但这种组织方式对信息的描述还不够深入,必须在建立严格的主题树网络之后应用。由于关键词的广泛关联作用,其搜索的准确性较低,也造成了整体的复杂冗余,也一定程度上降低了信息利用率。

3.1.3元数据组织法

专门用于描述数据特征和属性的数据,即有关该数据的数据被称为元数据。包括数据库和搜索引擎。元数据是对资源信息的描述。目前常见的类型有MARC、GILS、TEI、FGDC、DC、IAFA等[13]。

应用元数据法,可以对信息资源的现有一般信息即内容和主题等进行更深入的描述,网络信息资源的描述和组织使用户可以更方便地组织和评估信息资源,以便做出快速,合理的决策和选择。元数据组织是相比前两种传统组织法方法而言更深入的组织方法。

3.2新型数字信息组织方法

随着网络的扩展,互联网上的信息量呈爆炸式增长趋势。信息系统需要维护的数据库也变得非常庞大。采用传统的检索方法来查询这样的量网络信息是非常耗时的,有时也很难满足用户的信息需求。在对异质异构的海量网络信息资源进行组织时,急需更加自由简便、灵活易用的信息组织方式。在此背景下,本体、主题词表、分众分类法等新型的信息组织方式应运而生。

3.2.1本体

在信息科学领域,为了提高网络信息检索系统检索精度和效率,人们引入本体技术作为技术手段。作为一种工具,本体使用独特的功能来提供一种有效的方法来解决网络中信息资源的各种问题。本质上,它描述了网络中的概念及其之间的关系,并在共享范围内具有清晰唯一的定义。[14]本体技术最近已引起计算机和情报界的关注。如今,本体已广泛用于语义Web,智能信息检索,信息集成和数字图书馆等领域。

3.2.2分众分类法

最早由信息科学家托马斯·范德(Thomas Vander)首先提出的分众分类法是一种适应互联网发展的新型知识自组织方法。该分类方法更加方便灵活,结合了用户的认知度,突出了群体智慧与合作的重要性,促进了用户信息的获取与交流。分众分类法的执行主体是普通网络用户,用户是直接参与信息组织工作的,用户可以在发布信息时标记信息资源或标记信息,也可以在没有专家或工具协助的情况下单独完成知识组织任务。分众分类法主要用于组织网络信息资源,但由于其等级结构划力不明确,准确性和时效性差,应用范想较为狭窄。

3.2.3主题词表

主题词表,又称叙词表、检索词表或词库,与自然语言相比,主题词表是经过标准化,系统化的定义的名词术语的集成。主题词汇表是指专家如何使用领域叙词表来定义和组织单词及其语义关系。主题词表已经从传统的知识组织方法转变为构建知识组织系统的重要手段,并已成为大规模网络知识组织系统中必不可少的工具之一。但是词汇量的可扩展性很低,并且编译复杂需要大量的人力和时间资源,并影响词表的及时性。

4网络信息资源信息组织的发展趋势和影响

在web2.0不斷向web3.0演进的过程中,作为交互层的结构性要素的信息组织也呈现出自动化和个性化的演进趋势。我们就这两个特征出现的依据和它们涉及的技术进行梳理,不难发现技术架构和标准与用户需求不断耦合的过程,而随着技术的进步,用户对互联网信息也有了更高更个性化的需求,也为更高层次的信息组织方式乃至网络信息的自组织和建构的演进指出了前进的方向。下面先就信息组织的自动化和个性化两个特征进行探讨:

4.1网络信息资源组织的自动化发展

基于大数据和云计算等技术的发展,网络信息资源从数量到结构与以往相比都有了飞跃式的丰富,而存储和计算的设备和架构也与以往有了本质的不同。另外,越来越多的技术和设备被引入到有关网络信息资源的组织和评估的研究工作中,当前的研究方法和模型页已经改变和完善。同时,随着信息资源总量的增加,基于海量数据乃至图片和流媒体的无监督学习成为可能,给信息组织的自动化铺平了道路。对于用户而言,可以更便捷的享受研究成果,对网络资源组织者来说,应该致力于改善用户体验、强化以用户为中心的原则,我们可以从以下两个层次对网络信息资源组织的自动化进行展望:

4.1.1主题分类一体化的发展趋势

在信息资源的数量和种类日益丰富的当下,进行网络信息资源组织可以更尊重它们本身的属性和粒度,具体而言就是使用分类主题一体化方法来组织网络信息。在以往的信息资源组织中,分类方法基于事物的主题属性执行族性检索,但是主题方法是一种特征搜索,具体取决于反映人类思维的两个不同方面的主题类别和执行。而在当下的技术条件下,我们可以尊重人们本来的认知过程,通过将分类法和主题方法有机地结合在一起,分类主题一体化对于加强分类搜索和主题检索之间的关系是有用的,便于从主题角度充分利用分类系统。

4.2社交网络的兴起为网络信息资源组织引入的个性化要素

标签是标准的Web 2.0组件之一,最初旨在满足多维分类的需求。这是基于对信息资源的概括和理解,是对信息内容的个人理解的注释,可以不一定是主题,且可以是与时间,内容或信息资源无关的词,标签比关键词更方便,并且可以从多个维度来提示信息的内容和分类。大众标注是取决于用户决定的一种分类方式。用户可以通过为博客、照片、喜炊的网页等添加一个或多个标签来自己组织内容。这种更自由和灵活的功能极大地增强了网站的可用性,功能和个性化。

特别是在社交媒体兴盛的当下,大众标注多维度的特性能够准确反应网络信息的传播和使用的状况,通过改变一个事件的标注就可以让传播和利用的途径和方式发生根本的改变,使用户对网络信息资源的自我组织和管理成为可能,让网络资源的信息组织更趋于个性化。另外,公共标签是灵活可变的标签,信息资源标签的粒度是可变的,因此用户信息资源标签更适合于用户时代的需求。通过将公共注释的多维特征和注释的灵活可变功能同时应用于信息资源注释,信息资源的组织和分类变得更加详细和灵活。

传统意义上的信息组织更偏重于信息分类,识别系统来表述信息内容、导航系统负责查看信息和控制信息,用户可以通过搜索找到所需的信息。社交网络将上述的模块整合起来,基于庞大的数据流和自然语言处理技术导向了处理过程的自动化,在使用社交网络的过程中,社交网络信息资源组织根据用户的需求进行个性化,这必然指向信息组织向信息建构发展的趋势。

参考文献:

[1]周宁.信息组织[M].武汉:武汉大学出版社,2017:337-339.

[2]社会化媒体[EB/OL].[2019-05-18].https://wiki.mbalib.com/wi-ki/% E7%A4%BE% E4c/oBCo/0 9A% E5%8C% 96%E5%AA%920/oE4%BD%93

[3]范哲.社会化媒体情境中信息素养的内容框架研究[J].情报杂志,2012(31):170-174+164.

[4]张冰洁.Web3.0环境下图书馆信息咨询服务创新研究[D].大连:辽宁师范大学,2018.

[5]吴东阳,梁秋春.社会网络环境下的薪资组织与共享模式研究[J].传播与版权,2018(5):116-118.

[6]周寧.信息组织[M].武汉:武汉大学出版社,2017:348-352.

[7]晏凌,王应解.Intemet信息资源的组织策略——建立基于联机分析挖掘的导航系统[J].图书情报工作,2000(5).

[8]李洪,隋利玲.多媒体信息的组织和管理技术[J].现代图书情报技术,2000(2).

[9] Sebastiani F.Machine learning in automated text categorization[J].Acm Computing Surveys,2002, 34(1):1-47.

[10]钟莹,麦淑平,黎细玲.基于网络的信息资源组织与评价现状及发展趋势研究[J].图书馆学研究,2013 (3):67-71.

[11]郭海明.网络信息资源组织方式探析[J].情报资料工作,2003(3):50-52.

[12]崔金栋.基于本体的网格信息检索模型研究[D].吉林大学,2011.

[13]孙中秋,陈晓美,毕强.知识自组织与他组织方法类比与融合研究[J].数字图书馆论坛,2014(9):18-22.

[14]陈成,邵波.基于大众标注技术的网站信息构建研究[J].图书情报工作,2011,55(3):116-119+22.

【通联编辑:朱宝贵】

收稿日期:2019-10-25

作者简介:刘雨晴(1995-),女,黑龙江哈尔滨人,在读硕士研究生,主要研究方向为图书情报。

猜你喜欢
社会化分类资源
基础教育资源展示
牵手校外,坚持少先队社会化
分类算一算
一样的资源,不一样的收获
行政权社会化之生成动因阐释
分类讨论求坐标
数据分析中的分类讨论
资源再生 欢迎订阅
高校学生体育组织社会化及路径分析
公共文化服务亟须推进社会化