丝瓜

首页 » 常识 » 问答 » 什么是数据元数据主数据这可能是大多数
TUhjnbcbe - 2023/10/31 8:11:00
福建白癜风医院 http://nb.ifeng.com/a/20200114/8061710_0.shtml

大数据架构师曾经有段时间给甲方爸爸做项目的时候,他们看我长的显小,喜欢挑战一些问题,其中我遇到最多的就是“什么是元数据”。遇到这种问题既不能啰嗦,也不能太过于专业,否则领导会不开熏。另外,元数据、主数据也都是数据治理的核心中的核心。今天就给大家把这几个名词给彻底解释清楚。为什么要取这么多名字?我初入数据行业的时候也被一堆的名词给绕晕了。什么元数据、技术元数据、业务元数据、操作元数据、主数据、参考数据、事务数据、业务数据、维度、度量、指标等等等等,那时候简直一脑门子的官司。那时候就是刘姥姥进大观园,看啥都新鲜,看啥也都不懂,长期处于信息过载的状态。那时候也没有人帮我整理整理,自己也没时间去系统性的学习,只是硬着头皮边用边学,慢慢的加深理解。其实这些东西都是内在关联的。我梳理了一下,这样看就能清楚很多了:我们知道,面对大量信息的时候,最好的办法就是归类、合并、分解,把它们用一个结构组合起来,这样就能很容易的理解。其实所有的数据也是一样,我按照数据的记录、管理和分析三个用途,对这些数据名词进行归类,这样是不是就清晰多了?记录类数据什么是事务数据?事务是数据库的处理数据的一个单元,可以理解为一次数据库CRUD的操作。事务数据就是记录下数据库操作的系统日志数据,以及特定业务场景中,专门记录的业务操作事务记录的数据,比如用于安全审计的系统登录日志。什么是业务数据?业务数据就是为了完成业务流程而存储的业务操作类数据。就是业务系统的绝大多数表和数据。什么是日志数据?早期的日志数据是属于事务数据中的。现在大数据时代,用户访问数据变得越来越重要,所以单独分离出来。什么是元数据元数据(Meta-data)是描述数据的数据。如何理解这句话?以小学课文《翠鸟》为例,我告诉你这是一只翠鸟,如果你没见过翠鸟,你肯定无法理解翠鸟是个什么东西。但是如果是这样描述一下呢?翠鸟喜欢停在水边的苇秆上,一双红色的小爪子紧紧地抓住苇秆。它的颜色非常鲜艳。头上的羽毛像橄榄色的头巾,绣满了翠绿色的花纹。背上的羽毛像浅绿色的外衣。腹部的羽毛像赤褐色的衬衫。它小巧玲珑,一双透亮灵活的眼睛下面,长着一张又尖又长的嘴。上文在描述翠鸟,怎么描述的呢?从这几个方面:停在那儿、小爪子、颜色、头上的羽毛、背上的羽毛、腹部的羽毛、体型、眼睛、嘴。同理,现在我告诉一个数字:,你除了对这个数字有比较确定的量化意义之外,也无法理解具体代表了什么含义。但是如果是这样描述一下呢?这样是不是就很清楚了?的意思是:年统计的全国成年男性平均身高,该值的合理阈值是80-cm,数据目前存在MySQL中,访问连接是XXXX,由国家统计局的张三在年1月1日创建,数据目前是公开的,很安全,质量经过多重确认无误的。在描述这个数据,用了哪些描述项呢?单位、指标、统计时间、统计范围、合理阈值、数据库、表、字段、接口、创建人、创建时间、数据权限、质量等级等等。这些都是在描述这个数据。我们把描述这个数据的其他数据称之为“元数据”。当然,为了管理方便,我们同样还能将上述元数据进行归类:与业务规则、流程相关的描述性数据,我们称之为业务元数据;与存储、访问等技术底层的描述性数据,我们称之为技术元数据;与数据操作相关的描述性数据,我们称之为操作元数据;与数据管理相关的描述性数据,我们称之为管理元数据元数据可以解决什么核心问题?如上所述,元数据就是为了准确的描述我们拥有的所有数据。其核心的目的是降低人与数据之间的沟通成本。描述的越准确,我们使用数据的成本就越低。什么是主数据主数据(MasterData)就是关于业务实体的数据。主数据是关键业务实体的最权威、最准确、价值最大的数据,用于建立交易闭环。其实MasterData翻译成“核心数据”可能会更合适,因此主数据也被称为“*金数据”。这么说吧,其实阿里的OneID就是主数据理念的结果。对于CRM客户管理系统来说,用户就是主数据;对于银行来说,卡bin码、开户行、账号、理财产品等都是主数据;对于生产企业,BOM表是主数据;对于二手房平台,房源信息是主数据。贝壳的楼盘字典就是典型的主数据,他们从年开始建设,持续了12年,投入了5、6亿。所以我们总结一下,主数据一共有以下种类:与人相关的:用户、客户、公民、病人、供应商、学生等;与物相关的:实体产品、虚拟产品(理财产品)、生产资料(BOM表)等;与场相关的:地址库、楼盘字典、POI信息等;与规则相关的:财务的账套等。在传统IT企业,甲方公司的主数据可以立一个千万级的项目。国内也有很多公司专门做主数据这个行当。主数据的核心思想是全局唯一的标准数据。因此,主数据一般会完成以下工作:确定核心业务环节识别主数据定义和维护主数据匹配规则(代码规则、IDMapping)建立及发布数据标准主数据的后续维护及更新

1
查看完整版本: 什么是数据元数据主数据这可能是大多数