基于RSS架构的高校综合信息平台

2019-10-21 10:05孔祥瑜吴孟哲陈新宇孟泽鑫
科学与财富 2019年8期
关键词:信息平台分享高校学生

孔祥瑜 吴孟哲 陈新宇 孟泽鑫

摘要:本文主要论述了基于RSS的高校综合信息平台的建立及其应用方法。作为互联网上的最新技术之一,RSS通过XML标准定义了内容的包装和发布格式,使得信息发布、接收和使用更加稳定、高效、实时、安全、低成本。该平台实现了信息资源的自动提取与采集以及RSS自定义添加与分享,同时对采集到的信息进行分类、在线聚合,具有强交互性、高共享性、高度个性化、知识种类多样化等众多优点,具有一定的市场价值。

关键词:RSS;聚合;信息平台;分享;高校学生

一.RSS基本原理

RSS技术是基于XML标准建立的内容包装和投递的协议,它规范了网站发布更新消息时的格式,要求以XML格式记录信息的题目、作者、发布时间、摘要内容、相关的URL地址等。网站更新内容时,只需要按照RSS标准生成同样形式的文件,RSS订阅工具可以检测网站发布文件并自动地将更新的文件下载到本地。用户通过RSS reader可以浏览到相应频道给出的信息列表,通过刷新可以查看最新的频道更新内容。同时通过相应的URL地址可以链接到原始网站查看详细内容。RSS搭建了一个信息迅速传播的平台,使得用户可以不用逐个登陆网站而实时获取最新消息。RSS标准规定的XML格式文件使得文件中包含的信息能直接被其他站点调用,同时也能在其他的终端和服务中使用。

二.系统框架与功能分析

2.1系统框架设计

基于RSS架构的高校综合信息平台的个性化服务体现在用户可以定制频道内容,实现的关键在于收集用户个性设置。通过RSS订阅页面,收集用户个性设置,用于生成RSS频道描述信息。最终通过网站内置的简易RSS阅读器将用户定制内容展示在个人空间。如图2-1、图2-2所示,本平台系统总体设计采用目前比较流行的轻型框架组合SSH(Struts、Spring、Hibernate)实现。

RSS订阅页面收集用户个性设置信息,并将其存入个性设置数据库。RSS频道生成器根据用户识别代码,从个性设置数据库读取个性设置信息,用于查询公告信息和数据库,生成频道信息。用户可直接登录个人空间进行定制信息的阅读。

在用户端,RSS阅读器可以按照用户喜好。有选择性地将用户感兴趣的内容来源进行“聚合”,为用户提供多来源信息的“一站式”服务。

2.2系统功能分析

1、自动聚合信息资源

基于RSS的信息聚合功能,用户只需根据自身需要或兴趣,订阅相应的信息与资源,即可在聚合器获取到符合条件的所有资源,而不必为查找资源遍历各个信息资源网站,节省了大量时间,提高了效率。

2、自动过滤信息资源

基于RSS的信息过滤功能,用户还可以通过设置过滤掉不需要或不感兴趣的信息或频道,防止垃圾信息,方便本地資源管理,如文档分类排序、搜索和标记已读/未读等多种资源管理功能,所以大大方便了教学信息内容的解读以及管理。

3、自动更新信息资源

基于RSS的信息推送功能,服务器端更新的信息资源,会被及时主动地推送到聚合器上,从而确保了最新的信息资源能够在第一时间被发现并使用,用户不必再频繁登录网站以查询资源是否已更新。

三.系统实现的关键技术

3.1RSS解析

RSS feed就是RSS的Web内容源,有人叫它种子,由于RSS Feed是基于XML标准的,可看作是一种半结构化的数据模型,因此可以使用半结构化数据模型抽取技术,将RSS Feed文档描述与关系数据库中的属性一一对应起来,从而很容易地实现RSS Feed数据源的抽取与存储。

3.2信息内容过滤

在信息内容提取时,为了过滤掉广告、图标等影响用户阅读的杂质,设置了信息内容过滤器,通过对信息内容页面的分析,根据用户设置的过滤条件,对广告等杂质进行过滤。

3.3并行采集

为了提高采集效率,系统采用多线程技术对多个任务进行并行采集。主线程根据设置的最大线程数目和执行周期负责对各子线程的调用,子线程负责对各个启动的任务进行采集。

3.4重复内容检测

为了在采集时避免信息重复采集,在数据库中设计了抓取的链接记录表,详细记录每一条抓取过的链接,在每次信息采集时将采集到的源标题及其链接与数据库中的抓取链接记录表进行比较,如果抓取链接记录表中存在该条记录,则表示该条信息已经采集,不再进行采集。

3.5编码方式检测

由于采集的信息源来自于不同的网站,为了确定其编码方式,设计了编码检测器对其进行检测,由于编码方式一般在网页的开头,因此,编码检测器首先读取网页的前1000字节,然后从中提取编码方式。

4总结与展望

通过以上论述,我们知道,利用RSS技术可以使得高校综合信息平台具有如下优势:

(1)信息过滤:是充当知识和信息的“过滤器”,通过RSS技术让网络形成最好的知识积累方式,可以使得“隐性知识”真正通过网络实现“显性”化;

(2)信息搜集:简单进行订阅RSS频道,只要经过一些相关部门的整合,就可以搜集各高校网络上值得关注的信息,如从图书馆网站、或其他系部网站及时获得最新信息;

(3)信息推送:把学校网络上的最新信息变动推送给用户;

(4)信息交流:通过RSS技术,使得需要不断学习的各位学校用户,可以在很短的时间内,接触最鲜活的思想,浏览全球范围最好的新闻、文章、评论与报告,准确把握最新的热点、观点、动态和趋势;

随着RSS技术的快速发展和普及,必将推动高校网络教育的个性化智能化。

参考文献:

[1]胡智文.RSS与语义网研究[J].计算机工程与设计,2008,29(17):4618-4620.

[2]谢倩堃.RSS新闻的更新特征分析及RSS Reader的订阅模型[D].北京:北京交通大学电子信息工程学院,2008.

[3]Jussi Myllymaki. Effective Web Data Extraction with Standard XML Technologies[J]. Hong Kang, 2001(10):125.

猜你喜欢
信息平台分享高校学生
高校学生党支部建设及作用发挥探索
高校学生意外伤害事件应对与处理
孩子,我们慢慢来
高校实验室综合管理信息平台的构建分析
MVC框架技术搭建技能培训信息平台实例
浅谈包头市人影指挥综合信息平台的建设
小议高校学生违纪处分制度
试论快递行业自律评价信息平台的设计
关于高校学生工作的思考