c语言sscanf函数的用法是什么
313
2023-02-21
本文目录一览:
陈安蜀 李磊 李敏 牛广华 张燕
(中国地质调查局天津地质调查中心)
摘要 地质信息元数据记录元数据平台开发了地质数据的信息元数据平台开发,又区别地质数据本身元数据平台开发,借助地质信息元数据可以方便地实现数据资源的查找、发现、应用、管理和一体化组织。元数据服务是地质信息一站式服务的重要支撑。为了进一步推进华北地区地质成果数据库的应用,在更新维护中心16类地质信息元数据基础上,基于SOA架构开发了华北地质空间数据库目录服务系统,对于地质信息元数据服务利用具有很好的借鉴意义。
关键词 地质信息元数据 SOA 架构 目录服务
元数据(Metadata)是“关于数据的数据”,用于描述数据的内容、质量、表示方式、空间参考系、管理方式、数据的所有者、数据的提供方式以及数据集的其他特征[1]。地质信息元数据就是对地质数据描述的数据,地质信息元数据有3种用途元数据平台开发:一是作为数据的目录,提供数据集内容的摘要元数据平台开发;二是有助于数据共享,提供地质信息转换和使用所需要的数据内容、形式和质量方面的信息;三是内部文件记录,用以记录地质信息的内容、组织形式、更新维护情况等[2]。在地质调查中,地质信息元数据对地质调查空间信息的编目、管理、发布和社会服务起到了重要的指导和推进作用,帮助和促进人们有效地定位、评价、比较、获取和使用相关数据[3]。
1 地质信息元数据标准
自从开展数字国土以来,地质调查信息元数据先后采用了两种标准:一是《地质调查元数据内容与结构标准》(2001 版),二是《DD2006—05 地质信息元数据标准》。
《地质调查元数据内容与结构标准》是由8个数据表来描述数据集,元数据格式为以Access 2000为平台的“.mdb”文档形式。
《DD2006—05 地质信息元数据标准》中的元数据数据集由7个子集(UML 包)和14个代码表来描述数据集(图1)。元数据格式为xml编码格式和txt文本格式。其中元数据信息、标识信息、数据质量信息、内容信息是必选子集,空间参照信息、分发信息、引用和负责单位联系信息是可选子集,引用和负责单位联系信息是公用信息子集(表1),数据子项约230项。
图1 地质信息元数据概念结构图
表1 地质信息元数据标准内容
2 地质信息元数据的更新维护
目前华北地区不同专业的地质信息元数据共有16种,主要涉及国家基础地质数据库更新维护的各类数据库以及矿产资源潜力评价专题数据库的元数据,总计20427个(表2)。
表2 华北地区地质信息元数据情况表
由于地质资料中地质信息元数据是在不同时期建立的,元数据依据的标准与格式也不相同,只有统一的标准是能够规范的采集元数据和提供元数据信息服务的基础[4]。为了统一管理和服务,我们按现行的《DD2006—05 地质信息元数据标准》对以前完成的地质信息元数据进行整理与规范。
中国地质调查局发展研究中心按《DD2006—05 地质信息元数据标准》制定了地质信息元数据模板(地质信息元数据_ sample),开发了元数据采集器(Metadata_Editor)(图2)。因此在元数据更新维护过程中,依据地质信息元数据模板(地质信息元数据_sample),采用元数据采集器来整理规范元数据,可有效地保证元数据的统一性和准确性。
对元数据的更新维护主要从以下4个方面开展工作:
2.1 元数据XML文件错误
对于不能导入元数据采集器的元数据,通过程序,罗列出XML数据错误的元数据及其错误所在行列,对文件内容进行修改,如一些手工填写错误和文件类型错误,在此都进行了纠正,最后修改的数据也都经过了元数据采集器验证。
图2 地质信息元数据采集器界面
2.2 空间信息的整理
对元数据拐点坐标内容的准确性进行核实,通过空间数据比对,对元数据中填写错误的拐点信息进行更正,对不足小数位数的拐点补齐了小数位,使其数据精度更为准确。
2.3 字段内容的规范
通过编写批量处理XML数据程序,对元数据中字段内容共性的问题进行统一修改。具体修改内容如表3所示。
表3 元数据整理完善情况表
2.4 关键内容补充
(1)对关键词填写内容进行补充与规范
关键词001(标识学科分枝的关键词)的规范,区域地质图空间数据库统一规范为“区域地质图、空间数据库”
关键词002标识位置的关键词规范为“省、图幅涉及的市与县”
关键词004标识与数据集相关时间段的关键词规范为“建库时间”
关键词005标识特别的主题或论题的关键词的规范,区域地质图空间数据库统一规范为“区域地质图,地理信息系统”
(2)对验收意见具体内容进行补充与核实
部分数据库元数据提交时验收意见尚未下发,全面收集数据库的验收意见,补充完善到元数据中。
3 地质信息元数据的开发应用
做好地质资料数据服务工作,以快速方便的方式将这些数据信息提供给广大地质工作者,让国家地质数据库得到广泛的应用,是当前面临的主要问题[4]。
中国地质调查局发展研究中心依托网络采用B/S结构,开发了地质信息元数据管理系统(MDIS),授予大区中心超级管理员权限,可以在统一平台发布多元、异构数据库的信息,达到集群化、一站式社会化服务的目的。目前天津地调中心大部分地质信息元数据已经上传到该管理系统中,对外提供社会化服务。
为了进一步提高各种地质信息数据的共享水平和利用率,推进华北地区地质成果资料的应用服务,在构建地质信息元数据库基础上,基于SOA架构[5]开发了“华北地质空间数据库目录服务系统”。用户通过简单操作利用GIS空间查询与属性查询可快速定位所需的空间数据信息,并能查询下载到该信息的元数据。
系统开发基于ArcGIS for JavaScript API,使用的关键技术包括地图缓存技术、ArcGIS Server构筑空间数据平台技术、基于Web服务实现地理空间数据的共享应用模式技术、基于RIA技术的应用技术、先进的AJAX 运用技术、基于 ArcSDE 技术的长事务处理技术、地图 Mashup 应用技术。实现的基本功能:①GIS浏览(如放大、缩小、漫游、平移、鹰眼、经纬度显示);②底图切换,通过构建离线地理底图缓存地图服务,实现系统提供的ArcGIS 底图、Google离线底图、Google Earth底图切换,满足一些敏感数据的查询与使用;③空间查询,主要有基于标准分幅数据(1:5万、1:20万和1:25万)的空间查询、输入极值坐标与拐点坐标串的空间范围查询、整装勘查区、成矿远景区与成矿区带的业务数据空间查询、行政区查询、矩形或多边形的图形查询;④属性查询,对当前视图范围内的数据通过匹配关键词来进行属性查询;⑤查询结果筛选与显示,显示查询结果数目,对空间查询和属性查询出的结果可以再结合省份、矿种和专业进行筛选,显示信息与空间范围可以联动,对xml元数据信息以链接的形式显示,并提供下载元数据文件;⑥成果输出,对满足查询条件的结果导出Excel表,满足对外服务的需要[6]。
总之,地质信息元数据承担着地质资料数据资源查找、发现、应用、管理和一体化组织的重要任务,在地质信息更新维护过程中,地质信息元数据的规范性与准确性都应该得到充分的重视。除了传统的元数据目录服务方式外,基于元数据自身的空间信息,我们实现了基于元数据的空间目录服务,有效的扩展了元数据的服务方式与范围,对于地质资料实现了集群一体化管理,更好的发挥了社会化服务功能。
参考文献
[1]温英明,陈浩,代琦.基于XML的煤矿地质元数据目录服务研究[J].硅谷,2010,(14):96~97.
[2]李丰丹,李超岭,李浩川,等.地质空间信息元数据服务模式的实现[J].地质通报,2008,27(5):700~707.
[3]周敏,汪新庆.非规范化在元数据管理中的应用[J].计算机应用,2012,32(S2):26~28.
[4]王成锡,张明华.国家地理信息元数据管理系统的开发[J].国土资源信息化,2011,(2):12~15.
[5]Dave Peters.地理信息系统设计策略与构建[M].北京:测绘出版社,2012.
[6]李磊,陈安蜀,郑锦娜.华北潜力资源评价元数据空间目录服务系统建设[J].西北地质,2013,46(增刊):199~202.
元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据。需要元数据是用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。
描述信息资源或数据本身的特征和属性,规定数字化信息的组织,具有定位、发现、证明、评估、选择等功能。
一般认为,所谓元数据是关于数据的数据,或关于数据的结构化的数据。从已有的结论看,元数据的含义是逐渐发展的。元数据一词,早期主要指网络资源的描述数据,用于网络信息资源的组织;其后,逐步扩大到各种以电子形式存在的信息资源的描述数据。元数据这一术语实际用于各种类型信息资源的描述记录。
此外,元数据在地理界,生命科学界等领域也有其相应的定义和应用。
扩展资料
元数据的基本特点主要有:
a)元数据一经建立,便可共享。元数据的结构和完整性依赖于信息资源的价值和使用环境;元数据的开发与利用环境往往是一个变化的分布式环境;任何一种格式都不可能完全满足不同团体的不同需要;
b)元数据首先是一种编码体系。元数据是用来描述数字化信息资源,特别是网络信息资源的编码体系,这导致了元数据和传统数据编码体系的根本区别;元数据的最为重要的特征和功能是为数字化信息资源建立一种机器可理解框架。
元数据体系构建了电子政务的逻辑框架和基本模型,从而决定了电子政务的功能特征、运行模式和系统运行的总体性能。
电子政务的运作都基于元数据来实现。其主要作用有:描述功能、整合功能、控制功能和代理功能。
由于元数据也是数据,因此可以用类似数据的方法在数据库中进行存储和获取。如果提供数据元的组织同时提供描述数据元的元数据,将会使数据元的使用变得准确而高效。用户在使用数据时可以首先查看其元数据以便能够获取自己所需的信息。
参考资料来源:百度百科-元数据
最近Gartner在研究报告里明确指出,“元数据管理将是未来企业信息化的核心基础设施”。确实,在大数据环境中,如果企业不通过元数据管理把多种复杂的信息管理起来,很难做到信息的有效利用。但是,很多企业逐渐发现元数据管理直接给企业业务创新带来的价值非常有限。目前的元数据管理现状是什么?如何充分释放元数据管理的业务价值?有哪些实践经验可以借鉴?
目录:
一、现状分析:孤独的企业元数据管理
二、解决方案:面向业务释放元数据价值
三、技术实践:普元的企业元数据管理实践
一、现状分析:孤独的企业元数据管理
元数据管理不能给业务创新带来直接价值的主要原因,在于目前的元数据管理太“孤独”,这种孤独主要体现在以下四个方面:
管理范围窄:目前元数据管理范围窄主要体现在两个层面:第一,只管理了数据仓库相关的元数据,没有将元数据管理扩展到整个企业层面;第二,即使在数据仓库领域,也只管理了部分技术元数据,技术元数据的缺失导致元数据系统不能展现出企业系统的真实情况,业务元数据的缺失导致最终大家只能得到一堆缺少具体业务含义的表结构。
业务难结合:因为缺少和业务的结合,很多企业做完元数据管理系统之后,发现只是数据管理部内部人员在使用,其他部门的人根本没法用。系统都应该是为业务服务的,只有一个部门的人在用的系统是没有生命力的,如何让各部门的人都会使用元数据管理系统是一件很重要的事。
应用场景缺:目前,大部分元数据的应用场景都局限于元数据系统的内部功能,比如血缘分析,血统分析,版本管理等,这些功能都是企业在信息化里面使用到的,但实际上元数据的作用不只是体现在这些有限的功能上。
技术不完善:技术的不完善导致了以上一系列问题的出现。扩展性不强,导致很多元数据管理工具没办法管理企业业务数据和架构;采集能力差,导致只能通过手工做辅录,人工成本高,不能建立完整的信息链路;实时性不高,导致很多企业的元数据管理还停留在T+1(甚至不是T+1)阶段,不能实时了解数据资产状况,跟不上企业数据增长的速度。
二、解决方案:面向业务释放元数据价值
为了让元数据管理摆脱以上“孤独”的现状,可以从四个方面着手:
在技术上增强扩展性,实现自动化采集第一,增强扩展性。现在大部分元数据产品都是符合CWM标准的,只能管理数据仓库相关的元数据,不支持业务、架构等元数据的采集,以位于CWM下一层的MOF为基础,能有效解决扩展性的问题,通过此种方式,普元用元数据管理了新一代平台The Platform中整个微服务架构,实现了服务、数据以及运维过程的统一管理。第二,提升采集能力。元数据管理要采集各种各样的元数据,包括脚本、存储过程、报表等,还得分析各种各样的语法树,这对系统的采集能力要求是很高的,普元的元数据管理平台已实现用自动化提升系统的采集性能,能采集多种元数据,采集率几乎达到100%。
增强业务元数据管理能力,让业务用户广泛使用充分释放元数据管理业务价值的前提是让业务人员学会使用元数据管理系统,因此如何采集到业务元数据就变得非常重要。通过Excel采集业务元数据的方式,需要业务人员来填写各种各样的数据项,即使采集到系统中,也无法建立业务元数据与技术元数据的关联,无法体现业务数据在技术上的路径。为了解决上面的问题,自动化采集是必不可少的,另外还可以通过从文档里去分析业务元数据,再和技术元数据做对应的方式,让更多用户参与到元数据系统的使用上来。
与业务结合,实现面向业务的定制化应用现在元数据管理系统只局限在内部特定功能的使用,为发挥元数据管理的价值,应该把元数据做成一个服务化的系统,嵌入到企业各个场景中,给其他系统提供能力,让其他系统变得更自动化,让元数据管理变成企业一个很重要的基础设施,集成到企业信息化的方方面面。
打通数据生产线,形成自助数据供给不少企业都遇到过这样的问题:开发人员向数据部门索要数据时,数据部门需要逐个讲解数据的含义并把数据导过去,讲解的难度随着系统的增多而增大。元数据能帮助企业打造一个自助的数据生产线,让开发人员很容易地从数据平台中拿到所需数据,把整个产业线变得更简单,减轻数据部门的工作量的同时还能提高业务开发人员的满意度。
三、技术实践:
普元的企业元数据管理实践
中国东方航空:业务化的数据地图原来的数据地图只有技术人员能看懂,但是业务人员更关心和业务相关的事情,关心的是业务数据的分布。所以,普元梳理了整个东航的模型,用业务人员能理解的方式展现出了这些数据。通过数据资产管理平台的建设,东航实现了业务化数据地图的展现。普元借鉴达美航空经验,分析了航空领域模型中近2000个实体,逐个核对了1249张业务系统表数据,梳理出了数据主题域、数据实体、业务系统在内的三层结构的数据地图:包括航班、票务等13个主题域,针对每个主题域给出了多达227个业务实体目录及定义,给出了每个业务实体对应的数据库表与业务系统。
浙江电力:基于业务元数据的业务用户自助数据查询因为业务人员的IT水平有限,没办法自己设计报表,也没办法自助查询数据,所以浙江电力每天都要处理大量来自业务人员的需求。普元帮助浙江电力梳理了所有的元数据,并跟报表线做了整合,通过对应业务元数据和技术元数据,让业务人员可以查询业务数据对应的技术通路,从而自助设计报表,大大减小了数据部门的工作量;普元还帮助浙江电力做了针对业务流程的数据地图,业务人员从数据地图上能直接看到每个流程节点对应的数据,通过这种方式,让业务用户自己找到所需的数据。
德邦物流:自动化、实时的数据资产采集德邦已经建立了比较完善的数据平台,普元元数据管理平台,帮助德邦管理了90多个业务系统,优化了整个现有流程,实现了各种环境的自动化采集(数据库、ETL、服务、报表、GP、存储过程等),采集准确率达到了95%-99%。自动化采集之后,德邦放心地去掉了500多张报表中跟任何系统都没有关联的50张无用报表,大大减少了报表维护费用。
对于开发中的测试部署阶段,理想状况下,设计态、测试态、生产态中的元数据是一致的,通常开发管理者需要比对设计态和生产态,根据比对结果判断系统能否上线,运维人员也需要在系统上线之前,提前分析出系统上线给其他系统带来的影响。之前这些都需要人工完成,项目完成后,元数据已经融入了德邦的每一个开发环节,通过元数据管理系统可以完整比对不同状态之间元数据的差别,直接给出对比差异报告,开发管理者和运维人员根据报告就能判断系统能否上线。
元数据元数据平台开发的基本意义
Metadata(元数据)是“关于数据的数据”;
元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具;
元数据为分布的、由多种数字化资源有机构成的信息体系(如数字图书馆)提供整合的工具与纽带。
离开元数据的数字图书馆将是一盘散沙元数据平台开发,将无法提供有效的检索和处理。 Metadata的应用目的
(1)确认和检索(Discovery andentification)元数据平台开发,主要致力于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。
(2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。
(3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Digital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。
(4)资源保护与长期保存(Preservation and Archiving),支持对资源进行长期保存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转换方式(Migration Methods)、保存责任等内容。
Metadata在不同领域的应用 根据不同领域的数据特点和应用需要,90年代以来,许多Metadata格式在各个不同领域出现
例如:
网络资源:Dublin Core、IAFA Template、CDF、Web Collections
文献资料:MARC(with 856 Field),Dublic Core
人文科学:TEI Header
社会科学数据集:ICPSR SGML Codebook
博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core
政府信息:GILS
地理空间信息:FGDC/CSDGM
数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images
档案库与资源集合:EAD
技术报告:RFC 1807
连续图像:MPEG-7
Metadata格式的应用程度
不同领域的Metadata处于不同的标准化阶段:
在网络资源描述方面,Dublin Core经过多年国际性努力,已经成为一个广为接受和应用的事实标准;
在政府信息方面,由于美国政府大力推动和有关法律、标准的实行,GILS已经成为政府信息描述标准,并在世界若干国家得到相当程度的应用,与此类似的还有地理空间信息处理的FGDC/CSDGM;
但在某些领域,由于技术的迅速发展变化,仍然存在多个方案竞争,典型的是数字图像的Metadata,提出的许多标准都处于实验和完善的阶段。
Metadata格式“标准化”程度问题
Metadata开发应用经验表明,很难有一个统一的Metadata格式来满足所有领域的数据描述需要;即使在同一个领域,也可能为了不同目的而需要不同的但可相互转换的Metadata格式。
同时,统一的集中计划式的Metadata格式标准也不适合Internet环境,不利于充分利用市场机制和各方面力量。
但在同一领域,应争取“标准化”,在不同领域,应妥善解决不同格式的互操作问题。 总体结构定义方式 一个Metadata格式由多层次的结构予以定义:
(1)内容结构(Content Structure),对该Metadata的构成元素及其定义标准进行描述。
(2)句法结构(Syntax Structure),定义Metadata结构以及如何描述这种结构。
(3)语义结构(Semantic Structure),定义Metadata元素的具体描述方法。
内容结构
内容结构定义Metadata的构成元素,可包括: 描述性元素、技术性元素、管理性元素、结构性元素(例如与编码语言、Namespace、数据单元等的链接)。
这些数据元素很可能依据一定标准来选取,因此元数据内容结构中需要对此进行说明,例如MARC记录所依据的ISBD,EAD所参照的ISAD(G),ICPSR所依据的ICPSR Data Preparation Manual。
句法结构
句法结构定义格式结构及其描述方式,例如元素的分区分段组织、元素选取使用规则、元素描述方法(例如Dublin Core采用ISO/IEC 11179标准)、元素结构描述方法(例如MARC记录结构、SGML结构、XML结构)、结构语句描述语言(例如EBNF Notation)等。
有时,句法结构需要指出元数据是否与所描述的数据对象捆绑在一起、或作为单独数据存在但以一定形式与数据对象链接,还可能描述与定义标准、DTD结构和Namespace等的链接方式。
语义结构 语义结构定义元素的具体描述方法,例如 描述元素时所采用的标准、最佳实践(Best Practices)或自定义的描述要求(Instructions)。
有些元数据格式本身定义了语义结构,而另外一些则由具体采用单位规定语义结构,例如Dublin Core建议日期元素采用ISO 8601、资源类型采用Dublin Core Types、数据格式可采用MIME、识别号采用URL或DOI或ISBN;
又如OhioLink在使用VRA Core时要求主题元素使用AAT、TGM和TGN,人名元素用ULAN。 元数据编码语言
元数据编码语言(Metadata Encoding Languages)指对元数据元素和结构进行定义和描述的具体语法和语义规则,常称为定义描述语言(DDL)。
在元数据发展初期人们常使用自定义的记录语言(例如MARC)或数据库记录结构(如ROADS等),但随着元数据格式的增多和互操作的要求,人们开始采用一些标准化的DDL来描述元数据,例如SGML和XML,其中以XML最有潜力。
元数据制作方式
(1)专门编制模块(例如对MARC、GILS、FGDC等)
(2)数据处理时自动编制(例如对Dublin Core等)
(3)数据物理处理时自动编制(例如数字图像扫描时的某些元数据参数)
(4)共享元数据(例如OCLC/CORC、IMESH 元数据互操作性问题
由于不同的领域(甚至同一领域)往往存在多个元数据格式,当在用不同元数据格式描述的资源体系之间进行检索、资源描述和资源利用时,就存在元数据的互操作性问题(Interoperability):
多个不同元数据格式的释读、转换和由多个元数据格式描述的数字化信息资源体系之间的透明检索。
元数据格式映射
利用特定转换程序对不同元数据元格式进行转换,称为元数据映射(Metadata Mapping/Crosswalking)。
目前已有大量的转换程序存在,供若干流行元数据格式之间的转化,例如
Dublin Core与USMARC; Dublin Core与EAD
Dublin Core与GILS; GILS与MARC TEI
Header与MARC FGDC与MARC
也可利用一种中介格式对同一格式框架下的多种元数据格式进行转换,例如UNIverse项目利用GRS格式进行各种MARC格式和其它记录格式的转换。格式映射转换准确、转换效率较高。不过,这种方法在面对多种元数据格式并存的开放式环境中的应用效率明显受到限制。
标准描述框架
解决元数据互操作性的另一种思路是建立一个标准的资源描述框架,用这个框架来描述所有元数据格式,那么只要一个系统能够解析这个标准描述框架,就能解读相应的Metadata格式. 实际上,XML和RDF从不同角度起着类似的作用。
XML通过其标准的DTD定义方式,允许所有能够解读XML语句的系统辨识用XML_DTD定义的Metadata格式,从而解决对不同格式的释读问题。
RDF定义了由Resources、Properties和Statements等三种对象组成的基本模型,其中Resources和Properties关系类似于E-R模型,而Statements则对该关系进行具体描述。
RDF通过这个抽象的数据模型为定义和使用元数据建立一个框架,元数据元素可看成其描述的资源的属性。
进一步地,RDF定义了标准Schema,规定了声明资源类型、声明相关属性及其语义的机制,以及定义属性与其它资源间关系的方法。另外,RDF还规定了利用XML Namespace方法调用已有定义规范的机制,
数字对象方式
建立包含元数据及其转换机制的数字对象可能从另一个角度解决元数据互操作性问题。
Cornell/FEDORA项目提出由内核(Structural Kernel)和功能传播层(Disseminator Layer)组成的复合数字对象。
内核里,可以容纳以比特流形式存在的文献内容、描述该文献的元数据、以及对这个文献及元数据进行存取控制的有关数据。
功能传播层,主功能传播器(PrimitiveDisseminator)支持有关解构内核数据类型和对内核数据读取的服务功能,还可有内容类型传播器(Content-Type Disseminators),它们可内嵌元数据格式转换机制。
例如,在一个数字对象的内核中存有MARC格式的元数据,在功能传播层装载有请求Dublin Core格式及其转换服务的内容类型传播器。当数字对象使用者要求读取以Dublin Core表示的元数据时,相应的内容类型传播器将通过网络请求存储有Dublin Core及其转换服务程序的数字对象,然后将被请求数字对象中的MARC形式元数据转换为Dublin Core形式,在输出给用户。 跟踪元数据发展、积极参与制定元数据标准、加快元数据应用、注意国际接轨。
加快研究有效利用元数据进行检索(包括异构系统透明检索)、相关性学习、个性化处理等的机制。
加快研究元数据与数字对象和数字化资源体系有机整合的途径与方法。
推进研究利用元数据进行基于知识的数据组织和知识发现。
初期的元数据管理通常是在事后由相应的元数据管理软件,从已开发完成的应用系统中抽取用户所关注的各类元数据,再由人工补录一些注释和管理用的属性。这种模式称之为基本元数据管理,由于存在元数据获取的不及时,存在为了减少工作量有些属性空缺的风险,存在对应用体验支持力度的不足,实际应用并不普遍。在新一代应用系统(AS2.0) 中,业务功能通常都是由相应的构件,以人机交互的形式,通过在人工业务语境的对话过程中组装实现的。这个过程中,不仅完成了业务应用所需要的应用软件元素,同时也完成了应用软件元素相对应的元数据的采集。这种模式称之为主动元数据管理。以下是元数据管理的主要功能,后2部分属于主动元数据管理的内容。 元模型管理。利用可视化的用户体验,实现包括元模型添加、删除、修改、发布等维护功能;并且能让用户直观地了解已有元模型的分类、统计、使用情况、变更追溯,以及每个元模型的生命周期管理等等。
元数据管理。元数据管理实现针对元数据的基本管理功能。如元数据的添加、删除、修改属性等维护功能;元数据之间关系的建立、删除和跟踪等关系维护功能;提供元数据发布流程管理,可以更好地管理和跟踪元数据的整个生命周期;元数据自身质量核查、元数据查询、元数据统计、元数据使用情况分析、元数据变更、元数据版本和生命周期管理等功能。
元数据分析。元数据分析功能主要实现针对元数据的基本分析功能。包括血缘分析(血统分析)、影响分析、实体关联分析、实体影响分析、主机拓扑分析、指标一致性分析等。 各类应用软件元素产生的元数据进入元数据平台后,元数据管理可通过元数据服务功能,为需要这些元数据的工具软件或构件提供元数据服务。如将前面所述的各种工具软件的定义结果,以相应的标准协议进行打包形成方案(应用脚本),提供给其它应用环境中的物理表建立工具、ETL工具、多维模型建立工具、结果展现工具等底层工具,从而实现应用的重用和共享。同时,元数据服务还可为业务应用功能提供辅助的元数据帮助信息,如业务功能中加工结果和指标的说明、提示,及其血缘分析等,让用户可明确、直观地了解数据的来源、加工过程及加工算法等信息。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~