admin 管理员组

文章数量: 1086019


2024年6月16日发(作者:z型檩条截面特性)

第l2卷第1on 

2013年10月 

软件导刊 

Software Guide 

Vb1.12NO.10 

Oct.2013 

基于Web3.0的远程教育系统研究 

刘晓刚 

(浙江经贸职业技术学院,浙江杭州310018) 

摘 要:根据我国当前远程教育的现状和困难,提出了建设基于Web3.0技术的远程教育系统,以提供更强的资源共 

享、智能化、个性化的能力。给出了新型远程教育系统的预处理工作机制和系统结构,描述了系统的工作流程和主要 

功能。 

关键词:Web3.0;运程教育;系统设计 

中图分类号:TP319 文献标识码:A 文章编号:1672—7800(2013)0010—0132—03 

1.3实现智能化和个性化 

1 建立基于Web3.0的远程教育系统意义 

基于Web 3.0的远程教育系统可以提供传统系统所 

没有的强大能力,非常适合中国大规模的远程教育市场, 

主要体现在以下几点: 

1.1 有利于实现远程教育的标准化 

当前的远程教育系统中,教学课程的提供者把设计好 

的课件存储在服务器中,等待用户通过浏览器访问,这样 

的远程教育缺乏对用户学习的指导性,没有充分体现出教 

师的主导地位,也不会根据学习者情况智能化地调整学习 

策略。基于Web3.0的远程教育系统具有智能化识别功 

能,对于不同用户,系统根据用户的兴趣、爱好等方面内 

中国当前还没有制定关于远程教育的技术标准和文 

容,通过内容筛选,基于用户行为、习惯和信息的聚合,自 

动提供给用户最合适的学习方案和学习资源;学生可以参 

与多个群组社团的学习,发表评论、撰写心得、上交作业、 

参加测评,系统专门为学生汇总这些信息,收集起来提供 

给老师检查评分。基于Web 3.0的远程教育最具吸引的 

特点之一是可以实现个性化教育,不但学生可以按照自己 

的兴趣、爱好、时间等自主地安排学习进度、选择学习内 

容,而且智能化系统根据收集的数据主动分析学生的基 

档标准,各网络学校的远程教育系统自成体系,资源格式 

不统一,无法实现有效交流。基于web3.0的远程教育系 

统可以充分发挥Web 3.0的特点,统筹使用各地软、硬件 

资源,提供强大的网络教学能力和资源提供能力。如在中 

国的西部不发达地区,普遍存在着软、硬件建设滞后的现 

象,而且这个问题也不可能短期内得到解决。通过基于 

web 3.0的远程教育系统,可以整合东、西部各地的软、硬 

件,统一提供强大的服务能力,有效避免资源的重复建设。 

1.2实现高效资源共享 

础、能力、兴趣爱好等因素,自动为学员提出合适的学习方 

案和学习建议。 

总体而言,web 3.0不仅仅是一种技术上的革新,而 

是以统一的通讯协议,通过更加简洁的方式,为用户提供 

更为个性化的互联网信息资讯定制的一种技术整合,它将 

会是互联网发展中由技术创新走向用户理念创新的重要 

除了继续使用云计算、移动互联网技术之外, 

web 3.O还采用社群化服务技术,这些技术可以大大提高 

资源的共享程度。如果知道了用户的朋友是谁,有哪些偏 

好,Web 3.0系统就可以自动帮助用户过滤数据、增加应 

步。同时,基于web 3.0的远程教育系统将会使网络 

用,提高数据的应用效率。另外一方面,web 2.0的信息 

分享是单方向的,而web 3.0的信息内容跨平台同步,任 

何一个网站平台的信息可以直接和其他网站平台的信息 

进行交流和补充,能通过第三方信息平台同时对多家网站 

学习无处不在,你可以在任何地方、任何时间、任何设备上 

学习,使用各种移动设备都能方便地接驳应用。只要付出 

了努力,学员就可以取得远程教育的好成绩。 

信息进行整合使用。用户在互联网上拥有自己的数据,并 

能在不同的网站上使用;用户在各网站平台上的文章、留 

2基于Web3.0远程教育系统设计 

2.1数据预处理机制 

言和回馈信息等,被自动地聚集在一起,方便用户观看、回 

复,也可以方便教师集中评阅,这种双向数据共享的方式 

因特网上分布的web页面不仅数量巨大,而且是动 

态变化、无组织结构的,用户在Web上搜寻准确的信息非 

大大拓宽了信息交流的通道。 

作者简介:刘晓刚(197o一),男,硕士,浙江经贸职业技术学院教授、计算机系统分析师,研究方向为软件理论、信息系统。 

第1O期 刘晓刚:基于Web3.0的远程教育系统研究软 ・133・ 

常困难。一般的方法是使用搜索引擎搜寻Web站点、下 

载网页并创建相关的词句索引,但这样收回的结果中包含 

了大量不相关的信息,同时还损失了语义的含义。web 

3.0的模型应该是基于搜索+开放式TAG(关键词标签) 

+智能匹配的新门户,web 3.0时代的信息关联通过语义 

来实现,信息的可搜索性将会达到一个新的高度。我们采 

用基于语义的资源爬虫和资源鉴别模块来收集信息,从而 

避免搜索引擎的问题。 

(1)基于语义的资源爬虫。在数据预处理的过程中要 

构造一种基于语义的资源爬虫,爬虫是一个能够自动提取 

web文档的程序,它支持更有效地信息检索和分析,可以 

较少返回无关网页。爬虫能从混杂的数据源中收集数据, 

创建语义数据仓库,并且使用知识配置文件去指定资源、 

关键字、搜索顺序,以及查询进程的进度表。搜索进程是 

基于语义、时间驱动的,代替了传统web搜索进程中的问 

题激发和查询驱动 ]。资源爬虫算法的核心是构建资源 

优先值排序体系,我们采用资源相关度分析、网页内容分 

析、链接分析、参照物过滤、资源链接预测等多种方法进行 

资源相关度优先值的排序。如图1所示的爬虫模块部分, 

下面介绍该资源爬虫的工作原理。 

首先是爬虫抓取未访问的web网页进行处理,将初 

始的页面进行链接和内容分析。去除网页HTML标记和 

停用词,得到纯文本内容,并经过分词、词性标记处理,为 

后面的语义分析打下基础。完成预处理后,被访问页面中 

的链接结构以及内容资源相关实例词将被抽取并计量。 

第二步由资源链接预测模块对链接信息进行资源预 

测,计算得到资源链接相关度;为了实现“智能化”,让系统 

能够理解并整合资源和用户档案,采用适当的工具构建标 

准化、正规化、可操作化的自适应资源本体,该本体能够进 

行统计规则的自适应学习,达到更好的过滤效果。由网页 

内容分析模块基于资源本体对网页内容信息进行资源相 

关度的计算。 

第三步由资源相关度优先值计算模块将链接优先值 

和内容优先值统一起来,依据资源相关度优先值计算方法 

得到爬虫抓取的优先值序列。有了良好的优先值序列,爬 

虫的资源采集就能够顺利地进行。 

(2)资源鉴别模块。数据预处理首先使用一个资源鉴 

别模块去定位与收集相关的数据资源,如图1所示。在资 

源鉴别模块的数据准备阶段,用数据分类器去分类收集不 

同文件类型的数据,剖析器和索引器用于数据收集过程中 

的分析数据、建造索引和词典库。在后面的阶段,通过本 

体开发和元数据提取收集列表、关键字建议、摘要和分类 

组成,并用这些数据去创建原始数据数据库。最后依靠高 

水平的语义数据收集,帮助用户快速准确地定位信息。 

在对资源进行鉴别处理后,文档收集工作被基于语义 

的资源爬虫自动地执行。大多数的Web网页包含了其它 

网页的链接,爬虫几乎能从任何地方开始爬行。为了提高 

效率,确定爬虫要搜索提取的网页都是与资源相关的,爬 

虫被限制在从资源鉴别模块得来的特殊超链接资源中,处 

理不同类型的数据,收集所有的数据资源。为了提高爬行 

提取的效率,爬虫的工作是并行的。从网页收集的关键字 

都用作爬虫的初始种子去开始Web爬行。 

资源鉴别模块 \ 

爬虫模块 至 

资源相关 

I资源相关度分析 

度优先值 

计算 

网页内容分析lI 链接分析 

................ 、 ........嘉 ..,...一 

图1预处理工作机制示意 

为了使资源本体参照物具有自适应性,基于本体工程 

中本体学习的方法,在统计与规则下进行资源本体的自适 

应学习,达到更好的过滤效果。基于统计的本体学习模 

块,主要依据爬行过程中来自web环境的反馈,统计来自 

资源命中的反馈数据,根据领域本体框架图对其进行权重 

学习和继承关系演化。 

在预处理模块中,随着爬虫分析数据的不断产生,可 

以得到一系列资源相关度的分析数据,这些数据正好可以 

作为本体统计学习的训练数据集。其中包含一项重要的 

学习信息:概念词命中频率。将这一词频记录下来,用于 

对资源权重的学习。由此可以对资源本体参照物进行不 

断的学习进化,使得爬行更加科学有效。 

网页中的链接标记往往包含该网页的资源特征信息, 

而链接周围的文本内容是资源锚记的集中体现。如果链 

接指向资源相关页面,那么该网页也具有一定的资源相关 

性。所以可以依据资源链接关系的分析,得到网页资源相 

关度的另一个计算维度,这是资源链接分析预测模块的主 

要功能。 

2.2系统结构设计 

如图2所示,系统使用的入口包括学生学习平台,教 

师教学平台,社会媒体平台。无论在何时何地,使用何种 

设备,只要连接了因特网,学生都可以通过登录学生学习 

平台进行学习,并自动接收学习的评价和学分,一次登录 

可以享用所有的系统资源;教师可以随时随地登录教师教 

学平台进行教学,批改所属学生的作业和测评试卷,并把 

成绩和评语自动推送给相应学生。在平台上还能看到该 

学生在所有论坛、留言板、SNS等处发表的评论和学习心 

得,教师通过这些内容可以给学生评定平时成绩,同时了 

解学生的学习状态;社会媒体平台提供给非注册用户使 

用,这里功能受到限制,主要帮助非注册用户了解远程教 

育和报名信息,以及广告。 

在系统中有两个信息采集的通道:资源爬虫和用户提 

软件导刊 2013正 

交。按照图1的数据预处理机制,爬虫首先从预处理中获 

得不同系列的关键字,然后按关键字到Web上爬行收集 

信息。一些远程教育的网站和论坛地址被人工收集并作 

为爬虫的种子来提高效率。对于特定的搜索字段,资源爬 

虫能够收集关于这些字段的全面信息,包括:专业信息,课 

程信息,课程学分,学生信息,课件素材案例,教学音、视 

频,作业和试题等。同时,在各种社会媒体平台中的学生 

活动产生了另一类与学生相关的信息,这类信息可以看作 

学生的课外作业并用于学生的平时成绩评定、兴趣鉴别、 

搜索主题的热点和讨论热点。 

图2基于Web3.0的远程教育系统结构 

除了被爬行的数据,通过用户提交平台教师可以上传 

教学资源和信息,学生能够提交作业和问题。在用户提交 

平台中,要求采用统一的容易应用适应本体的预定义格式, 

能够传递课件、视频、文章和评论等。用户提交统一模块检 

查和调节用户的提交内容,使这些内容格式统一符合标准, 

便于适应本体的语义分析,然后存储于原始数据库。系统 

包含了高层和低层两套数据库,低层数据库存储爬虫收集 

和用户提交的原始数据,系统从低层数据库中通过适应本 

体提取更多的特定信息存储到高层数据库中。用户档案的 

元素如角色、兴趣等包含高效率鉴别相关数据的信息,还可 

以用于文档的过滤,是原始数据库里的重要内容。适应本 

体语义分析、检测并整理原始数据的各类信息,如从教学文 

章中得来的元数据,包括作者名、Email地址、联系方式等, 

还包括教师的个人网站地址和教学群组、学会、关联的学 

校,以及全国各地的远程教育学校地址等等,然后分类转存 

于各高层数据库中。有5个高层数据库,如图2所示。 

(1)专业信息库:包含了远程教育的各个专业的基本 

信息,包括人才培养方案、各专业中的课程信息、各课程的 

学分等。由于远程教育的特殊性,只要求学生学完规定的 

课程,完成毕业论文,拿到要求的学分就可以毕业,课程的 

学习顺序可以不作要求。这是系统的基础数据库,只允许 

经授权的教学管理者修改,该数据库只做每年一次的常规 

更新。 

(2)学生库:远程教育的学生众多,有必要建立专门的 

学生库。该库包含了学生的姓名、学号、性别、出生日期、 

专业名称、班级名、联系方式、家庭地址,还包括学习的成 

绩、所修学分、奖励和处分记录等。这个库也只允许经授 

权的教学管理者修改,除了每年一次的常规更新外,还有 

日常的学籍变动、学业记录等处理,如换专业、休学、学分 

奖励、处分记录等。 

(3)网络课程库:包括各种格式的音、视频,课件等。 

为了控制播放的质量,提高播放的流畅度,要求统一音、视 

频格式,音频统一采用MP3或WMA压缩格式,视频统一 

采用RMVB或WMV格式。 

(4)案例素材习题库:包括教学用的各种案例和素材, 

以及各门课程的习题。习题采用标准化的格式,客观题为 

主、主观题为辅,配有标准答案,可用作系统的平时作业、 

单元测试以及考试的自动出题。 

(5)社会媒体库:社会媒体团体的用户可以在系统中 

分享他们的资源,召开会议、在线讨论、成立兴趣小组、进 

行项目合作等。一个用户只需要注册一次就可以访问系 

统的Blog、微博、SNS和论坛服务。社会媒体的相关文 

章、评论,团体、群组的相关讨论,特别是从各类远程教育 

网站收集来的相关文章和新闻报道,以及在各论坛、Blog、 

微博、SNS和其它媒体平台上收集的相关评论都存储进该 

数据库。该数据库不仅存储用户的扼要介绍,而且记录用 

户的行为。 

从原始数据的内容中可以提取用户的兴趣点,如资源 

发布者个人档案中的研究兴趣描述,网站发布者的相关介 

绍,用户所属群组的发布文章、资源的细节、资源相关报道、 

介绍等。系统通过兴趣点产生器产生兴趣点的统计报告, 

管理者将根据这些报告跟踪热点资源并适时地调整热点, 

引导教师对热点资源的关注和投入。通过用户的兴趣信息 

还可以提取他们感兴趣的专业领域和研究倾向,这些信息 

除了提供给智能化服务,还有助于帮助系统构建本体。 

采用语义方法能够产生远程教育资源的信誉反馈和 

汇总报告,帮助资源开发者制定开发计划和开发方向。产 

生这些报告后,通过用户本体兴趣匹配模块去匹配用户的 

兴趣,产生匹配报告并且发送给相应的用户平台,教师或 

学生将从这个平台中收到报告。系统也将发送报告给合 

适的社会媒体平台,去帮助用户获得最新的信息。 

事件提醒产生器的功能是提醒重要学习事件。它在 

各种平台上列出将要发生的各种教学会议、视频直播和其 

它类型的活动,包含活动的主要题目、讲话者和时间段等。 

用户可以选择感兴趣的事件参加活动,如参加视频会议、 

在线讨论等。 

3 结语 

根据我国当前远程教育的现状和困难,本文提出了建 

设基于weh3.0技术的远程教育系统,以提供更强的资源 

共享、智能化、个性化的能力。文章给出了新型远程教育 

系统的预处理工作机制和系统的结构,描述了系统的工作 

流程和主要功能。未来的研究重点是平台的具体搭建和 

实现方法。 

参考文献: 

r1]刘晓刚,徐红丽.云计算在远程教育系统中的应用探索口].现代远 

距离教育,2010(5):64—67. 

[2]黄炜,张李义.基于语义爬虫的商品信息主题采集研究[J].现代图 

书情报技术,2OLO(1):3-8. 

(责任编辑:杜能钢) 


本文标签: 资源 用户 信息 数据 系统