首页       公司介绍       产品与服务       服务中心        成功案例       企业信息化
 
     
站内检索  
  • 公司动态
  • 他山之石
您现在的位置:首页 > 他山之石

浙江省政府网站十二类信息发布规范

2007-08-15 11:25:35 来源: 宁波市政府门户网站   1 制定背景
   “中国浙江”政府门户网站的内容主要来源于省政府办公厅和各部门、各市、县(市、区)政府子网站。门户网站整合各级子网站内容的手段主要有网上抓取、信息报送和网站链接等方式。其中网上抓取是“中国浙江”门户网站从各级子网站获取内容的主要方式之一。
  网上抓取所面临的问题是,各级政府及部门网站缺乏统一的内容格式规范,网站内容的变动缺少统一格式的索引,不利于采集工具自动抓取和分析信息,部分属性缺少或不易准确提取。为了更准确地采集和分析下属子网站的信息,需要规范网站的页面内容格式,并为网站内容的变更添加统一的索引。各级政府及部门网站按照统一要求经过规范化修改后,中国浙江政府门户网站可以通过内容整合系统准确地实现网上信息自动抓取。
 
2 名词解释
  网站内容整合:本规范所指的网站内容整合,仅限于对浙江省各级政府网站发布的底层静态网页内容的抓取,不包含对各类网上办事、网上申报、数据查询等应用服务系统中数据内容的整合。
  RSS标准:RSS(“Rich Site Summary”或“Really Simple Syndication”的首字母缩写)中文称作“简易信息聚合”,是信息聚合的国际标准。
  内容变更索引文件:记录网站每个小时内容变更情况的XML文件,标准格式为ZJEG_RSSYYYYMMDDhh.xml。当网站内容发生增、删、改等变化时,该时段的内容变更索引文件将同步更改。
  全网检索:在“中国浙江”政府门户网站提供的全文检索功能,指系统能够检索省内各级政府及部门网站的所有内容,并将各网站站内检索内容的结果统一合并处理后返回给查询用户。这样,用户得到的检索结果是各级政府及部门网站检索结果的合集。
 
3 制定目标
  本规范围绕信息采集和网页分析功能,在保持现有网站建设模式、不增加信息通道的前提下,使符合规范的网站发布的网页内容可被“中国浙江”政府门户网站内容整合系统自动识别、采集,并实现网页属性信息和内容字段信息的自动引用,最大限度减少人工介入。
  本规范结合配合“中国浙江”政府门户网站内容整合系统,实现以下目标:
  (1)   及时发现并收集网站的信息变更情况;
  (2)   准确分析网页属性信息;
  (3)   准确定位内容信息;
  (4)   实现门户网站与子网站之间内容的自动同步;
  (5)   实现政府网站群全网检索、RSS订阅等附加功能。
  为了实现上述目标,本标准制定了四方面条款,具体含义和作用说明如下:
  1.内容字段信息规范:要实现内容整合,首先应明确每一类信息内容必须包含的字段,以及各字段所定义的各项内容的书写规范,确保内容的完整和格式的统一;
  2.内容字段标注规范:对信息内容按规定的字段进行标注,使内容整合系统在抓取信息后,能将各字段下的信息准确定位到“中国浙江”政府门户网站对应网页的对应区域;
  3. 页面属性标注规范:一个内容网页中包含着标题、正文、作者、发表日期、正文、来源、唯一标识等基本属性,如果没有格式规范,内容整合系统很难确分析这些信息。通过制定统一的格式规范,可以实现网页属性信息的准确提取,并为分类检索打下基础;
  4.内容变更索引文件发布规范:用于标记网站单位时间内信息变更情况,通过对索引文件的分析,可以使内容整合系统程序判断哪些内容需要抓取,并获得这些内容的链接地址。
 
4 适用对象
  本规范适用于浙江省行政区域内各县级以上地方政府门户网站、省政府直属各部门网站发布的12类基本信息内容,中国浙江政府门户网站内容整合系统将全面支持本标准,实现对符合标准的政府网站的准确数据采集。
  具体类别及内容界定如下:
  机构职能:本政府机构名称、联系方式、工作职能等;
  领导信息:本政府机构领导的姓名、分工、联络方式等;
  工作规则:本政府机构履行职责时应遵循的有关规则;
  内设机构:本政府机构内设机构名称、职责、联系方式、负责人姓名等;
  法规文件:本政府机构或本系统有关法律、政府规章、规范性文件;
  讲话文论:本政府机构领导发表的重要讲话与文章;
  规划公报:本政府机构出台的或关于本系统的发展规划、政府公报
  人员任免:本政府机构发布的人事任免信息;
  动态信息:本政府机构或本系统发生的重要动态信息;
  公告公示:本政府机构公开发布的公告或公示信息;
  信息查询:本政府机构提供的网上信息查询服务;
  办事指南:本政府机构的行政许可、行政审批项目及其它办事项目的办理指南。
 
5制定原理和原则
  5.1 规范制定原理
  本规范结合了RSS标准的基本规则与浙江省政府网站信息内容的特性。实现规范的基本方法是,在网页HTML中,嵌入特定意义的标识信息,用于标注各项有意义的内容,这些嵌入的标识信息采用HTML的meta和特殊注释语句置标,在实现属性标注功能的同时,不影响网页的显示效果。
  构成网页的HTML文件逻辑上可以分为内容(Content)和页面展示(Style)两部分,内容部分包括网页的标题、日期、正文、作者等数据元素,它决定了网页所包含的信息;页面展示部分包括每个元素的位置、字体、大小、颜色等,它决定了网页在浏览器中的显示效果。HTML文件能够将内容和页面展示有机地结合为一体。
  本规范的制定主要从网页内容标注入手,从内容层面对网页进行标注,而忽略页面展示层面。具体方法是,利用HTML文件的特性,在不影响网页展示效果的前提下,加入各类属性置标,规定网站发布内容必须包含的信息。例如,在网页中标注网站信息、栏目信息、标题、日期、作者、来源等元数据内容,从根本上保证其它应用对该网页属性的准确识别和提取。
  5.2 规范制定原则
  浙江省各级政府及部门网站已经经历了多年的建设,花费设计和管理维护人员的大量心血。为了尽量减少网站的改动,规范制定过程中充分考虑了省内各级政府及部门网站的实际特点和改造难度,提供可行的操作规范。
更详细内容请浏览:宁波市政府门户网站
或查看附件:浙江省政府网站12类信息发布规范
地址:杭州市湖墅南路138号2F
Copyright 1999-2007 杭州亿迪安网络技术开发有限公司,拷贝复制必究                                            浙ICP备05018620号