数据仓库有4个特征分别是?
DW\u7684\u5c5e\u6027\u9690\u85cf\u4e86\uff0c\u600e\u4e48\u529e\uff1f\u5728\u83dc\u5355 - \u7a97\u53e3 - \u5c5e\u6027
\u6700\u597d\u628a\u4ee3\u7801\u7ed9\u51fa\u6765
\u94fe\u63a5
数据仓库的特点:
数据仓库是面向主题的;操作型数据库的数据组织面向事务处理任务,而数据仓库中的数据是按照一定的主题域进行组织。主题是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。
数据仓库是集成的,数据仓库的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出来,进行加工与集成,统一与综合之后才能进入数据仓库; 数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。 数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。 数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到当前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
数据仓库是不可更新的,数据仓库主要是为决策分析提供数据,所涉及的操作主要是数据的查询;
数据仓库是随时间而变化的,传统的关系数据库系统比较适合处理格式化的数据,能够较好的满足商业商务处理的需求。稳定的数据以只读格式保存,且不随时间改变。
汇总的。操作性数据映射成决策可用的格式。
大容量。时间序列数据集合通常都非常大。
非规范化的。Dw数据可以是而且经常是冗余的。
元数据。将描述数据的数据保存起来。
数据源。数据来自内部的和外部的非集成操作系统。
可以参考这篇文章:数据仓库(1)什么是数据仓库 - 知乎 (zhihu.com)
- 面向主题:
- 集成性:
- 非易失性(不可更新性)
- 时变性
传统数据库中,最大的特点是面向应用进行数据的组织,各个业务系统可能是相互分离的。而数据仓库则是面向主题的。主题是一个抽象的概念,是较高层次上企业信息系统中的数据综合、归类并进行分析利用的抽象。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。
通过对分散、独立、异构的数据库数据进行抽取、清理、转换和汇总便得到了数据仓库的数据,这样保证了数据仓库内的数据关于整个企业的一致性。
数据仓库中的综合数据不能从原有的数据库系统直接得到。因此在数据进入数据仓库之前,必然要经过统一与综合,这一步是数据仓库建设中最关键、最复杂的一步,所要完成的工作有:
数据仓库的数据反映的是一段相当长的时间内历史数据的内容,是不同时点的数据库快照的集合,以及基于这些快照进行统计、综合和重组的导出数据。
数据非易失性主要是针对应用而言。数据仓库的用户对数据的操作大多是数据查询或比较复杂的挖掘,一旦数据进入数据仓库以后,一般情况下被较长时间保留。数据仓库中一般有大量的查询操作,但修改和删除操作很少。因此,数据经加工和集成进入数据仓库后是极少更新的,通常只需要定期的加载和更新。
数据仓库包含各种粒度的历史数据。数据仓库中的数据可能与某个特定日期、星期、月份、季度或者年份有关。数据仓库的目的是通过分析企业过去一段时间业务的经营状况,挖掘其中隐藏的模式。虽然数据仓库的用户不能修改数据,但并不是说数据仓库的数据是永远不变的。分析的结果只能反映过去的情况,当业务变化后,挖掘出的模式会失去时效性。因此数据仓库的数据需要更新,以适应决策的需要。从这个角度讲,数据仓库建设是一个项目,更是一个过程。数据仓库的数据随时间的变化表现在以下几个方面:
(1) 数据仓库的数据时限一般要远远长于操作型数据的数据时限。
(2) 操作型系统存储的是当前数据,而数据仓库中的数据是历史数据。
(3) 数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性。
数据仓库的特征
1、数据仓库的数据是面向主题的
2、数据仓库的数据是集成的
3、数据仓库的数据是不可更新的
4、数据仓库的数据是随时间不断变化的
绛旓細銆愮瓟妗堛戯細A銆丅銆丆銆丏銆丒 鏁版嵁浠撳簱鏄闈㈠悜涓婚鐨勩侀泦鎴愮殑銆佺ǔ瀹氱殑銆佸弽鏄犲巻鍙插彉鍖栫殑鏁版嵁闆嗗悎锛岀敤浜庢敮鎸佺鐞嗗喅绛栵紝杩欎簺涔熼兘鏄鏁版嵁浠撳簱鐗圭偣銆侽LAP锛堣仈鏈哄垎鏋愬鐞嗭細On-IineAnalyticalProcessing锛夋槸鍩轰簬鏁版嵁浠撳簱鐨勪俊鎭垎鏋愬鐞嗚繃绋嬶紝鏄暟鎹粨搴撶殑鐢ㄦ埛鎺ュ彛閮ㄥ垎銆
绛旓細鏁版嵁浠撳簱鏄潰鍚戜富棰樼殑銆侀泦鎴愮殑銆佸叿鏈夋椂闂寸壒寰佺殑銆佺ǔ瀹氱殑鏁版嵁闆嗗悎,鐢ㄤ互鏀寔缁忚惀绠$悊涓殑鍐崇瓥鍒跺畾杩囩▼[2]銆傛牴鎹暟鎹粨搴撴蹇电殑鍚箟,鏁版嵁浠撳簱鍏锋湁浠ヤ笅4涓壒鐐: (1) 闈㈠悜涓婚銆備富棰樻槸鐢ㄦ埛杩涜鏌愰」鍐崇瓥鏃舵墍鍏虫敞淇℃伅鐨勬娊璞¢泦鍚堛傛暟鎹粨搴撴槸鎸変富棰樺煙杩涜鏁版嵁缁勭粐鐨勩傛暟鎹粨搴撲互涓婚涓虹粍缁囨暟鎹殑涓績,鏈夊埄浜庡疄鐜板喅绛栦俊鎭敮鎸...
绛旓細鏁版嵁闆嗗競浣滀负鏁版嵁浠撳簱鐨勪竴涓粍鎴愰儴鍒嗭紝搴斾粠鏁版嵁浠撳簱涓鍑猴紝涔熷氨鏄锛岄鍏堣寤虹珛鏁版嵁浠撳簱锛岀劧鍚庝粠鏁版嵁浠撳簱鑷劧鐢熸垚鏁版嵁闆嗗競銆備絾鍦ㄨ储鍔°佷汉鍔涜祫婧愬強绠$悊閮ㄩ棬锛屽湪鎶鏈拰绠$悊鐨勬垚鐔熷害鏈夐檺鐨勬儏鍐典笅锛屽厛寤虹珛鏁版嵁闆嗗競鍙互杈惧埌鍏堝彇寰楄瘯鐐圭粡楠岋紝鐒跺悗鎴愮啛涓涓張涓涓殑鏁堟灉銆傝繖鍚捣鏉ユ槸涓嶉敊锛屼絾鏄渶瑕佹敞鎰忕殑鏄暟鎹粨搴...
绛旓細Infobright鏄竴娆惧熀浜庣嫭鐗圭殑涓撳埄鐭ヨ瘑缃戞牸鎶鏈殑鍒楀紡鏁版嵁搴撱侷nfobright鏄紑婧愮殑MySQL鏁版嵁浠撳簱瑙e喅鏂规锛屽紩鍏ヤ簡鍒楀瓨鍌ㄦ柟妗堬紝楂樺己搴︾殑鏁版嵁鍘嬬缉锛屼紭鍖栫殑缁熻璁$畻(绫讳技sum/avg/group by涔嬬被)锛宨nfobright 鏄熀浜巑ysql鐨勶紝浣嗕笉瑁卪ysql浜﹀彲锛屽洜涓哄畠鏈韩灏辫嚜甯︿簡涓涓俶ysql鍙互绮楀垎涓洪昏緫灞傚拰鐗╃悊瀛樺偍寮曟搸锛宨nfobright...
绛旓細鍖哄埆涓昏鎬荤粨涓轰互涓嬪嚑鐐癸細1.鏁版嵁搴撳彧瀛樻斁鍦ㄥ綋鍓嶅硷紝鏁版嵁浠撳簱瀛樻斁鍘嗗彶鍊硷紱2.鏁版嵁搴撳唴鏁版嵁鏄姩鎬佸彉鍖栫殑锛屽彧瑕佹湁涓氬姟鍙戠敓锛屾暟鎹氨浼氳鏇存柊锛岃屾暟鎹粨搴撳垯鏄潤鎬佺殑鍘嗗彶鏁版嵁锛屽彧鑳藉畾鏈熸坊鍔犮佸埛鏂帮紱3.鏁版嵁搴撲腑鐨勬暟鎹粨鏋勬瘮杈冨鏉傦紝鏈夊悇绉嶇粨鏋勪互閫傚悎涓氬姟澶勭悊绯荤粺鐨勯渶瑕侊紝鑰屾暟鎹粨搴撲腑鐨勬暟鎹粨鏋勫垯鐩稿绠鍗曪紱4.鏁版嵁...
绛旓細鏌ヨ宸ュ叿鍜屾妧鏈佸簲鐢ㄧ▼搴忕瓑鍚涓鍩熼兘鍙互浠庡苟琛岀殑鏈鏂版垚灏变腑鑾风泭銆傚垎鍖哄垎鍖哄姛鑳戒娇寰楁敮鎸佸ぇ鍨嬭〃鍜岀储寮曟洿瀹规槗锛屽悓鏃朵篃鎻愰珮浜嗘暟鎹鐞嗗拰鏌ヨ鎬ц兘銆傛暟鎹帇缂╂暟鎹帇缂╁姛鑳介檷浣庝簡鏁版嵁浠撳簱鐜涓氬父闇瑕佺殑鐢ㄤ簬瀛樺偍澶ч噺鏁版嵁鐨勭鐩樼郴缁熺殑鎴愭湰锛屾柊鐨勬暟鎹帇缂╂妧鏈篃宸茬粡娑堥櫎浜嗗帇缂╂暟鎹鏌ヨ鎬ц兘閫犳垚鐨勮礋闈㈠奖鍝嶃
绛旓細鏁版嵁浠撳簱鐨鍥涗釜鍩烘湰鐗瑰緛:鏁版嵁浠撳簱鐨勬暟鎹槸闈㈠悜涓婚鐨勩佹槸闆嗘垚鐨勩佷笉鍙洿鏂扮殑銆佹槸闅忕潃瀹炶返涓嶆柇鍙樺寲鐨 6. 浠涔堟槸J2EE鍛?浠庢暣浣撲笂璁,J2EE鏄娇鐢↗ava鎶鏈紑鍙戜紒涓氱骇搴旂敤鐨勪竴绉嶄簨瀹炰笂鐨勫伐涓氭爣鍑,瀹冩槸Java鎶鏈笉鏂傚簲鍜屼績杩涗紒涓氱骇搴旂敤杩囩▼涓殑浜х墿銆 鐩墠,Java骞冲彴鏈変笁涓増鏈:閫傜敤浜庡皬鍨嬭澶囧拰鏅鸿兘鍗$殑J2ME(Java 2 ...
绛旓細2.1.3 鍘熷瓙绾ф暟鎹ā鍨嬪拰姹囨荤骇鏁版嵁妯″瀷骞跺瓨锛氬潥鎸佸師瀛愮骇鏁版嵁妯″瀷鍜屾眹鎬荤骇鏁版嵁妯″瀷骞跺瓨锛岃屼笖瑕佸敖鍙兘鍦扮粏鍖栧師瀛愮骇鏁版嵁銆2.1.4 璁剧珛浠g悊閿細浠g悊閿槸缁磋〃涓竴浜涙病鏈変笟鍔″惈涔夌殑瀛楁锛屽彧鏄竴涓敱鏁版嵁浠撳簱鍔犺浇绋嬪簭鏃跺缓绔嬬殑鏁板瓧銆2.2 绌洪棿鏁版嵁浠撳簱鏋勫缓鏂规硶銆傞殢鐫GIS锛堝湴鐞嗕俊鎭郴缁燂級鍦ㄥ悇琛屼笟鐨勫箍娉涘簲鐢紝鏈...
绛旓細1銆佹暟鎹粨搴撳拰鎿嶄綔鏃ュ織 鏁版嵁浠撳簱锛圖ata Warehouse锛孌W锛夐暱鏈熷偍瀛樺湪璁$畻鏈哄唴锛屾湁缁勭粐銆佸彲鍏变韩鐨勬暟鎹泦鍚堬紝鏄负鍐崇瓥鏀寔绯荤粺鎻愪緵鍩虹鏁版嵁鐨勫垎鏋愬瀷鏁版嵁搴撱鏁版嵁浠撳簱鏈鍑犱釜瀹氫箟鐗瑰緛锛屽嵆 锛氭帹鑽愰槄璇伙細涓銆佹暟鎹粨搴 - 鏋舵瀯鑹烘湳 - 鍗氬鍥 鏃ュ織鍜鏁版嵁浠撳簱鍏锋湁鐩稿悓鐨勪綔鐢紝浣嗙浉姣斾箣涓嬫棩蹇楃殑璁板綍姣旀暟鎹粨搴撶簿绠锛屼笖...
绛旓細锛2锛夋暟鎹泦鎴愪笌鏁版嵁浠撳簱 鏁版嵁浠撳簱锛圖ata Warehouse锛夋槸闈㈠悜涓婚銆侀泦鎴愩佺浉瀵圭ǔ瀹氥佸弽鏄犲巻鍙插彉鍖栫殑鏁版嵁闆嗗悎锛屾槸鍐崇瓥鏀寔绯荤粺鍜岃仈鏈哄垎鏋愬簲鐢ㄦ暟鎹簮鐨勭粨鏋勫寲鏁版嵁鐜銆備富瑕佷晶閲嶅鏈烘瀯鍘嗗彶鏁版嵁鐨勭患鍚堝垎鏋愬埄鐢紝鎵惧嚭瀵逛紒涓氬彂灞曟湁浠峰肩殑淇℃伅锛屼互鎻愪緵鍐崇瓥鏀寔锛屽府鍔╂彁楂樻晥鐩娿傚叾鐗瑰緛鏄闈㈠悜涓婚銆侀泦鎴愭с佺ǔ瀹氭у拰鏃跺彉鎬...