数据的抽取

数据的抽取是数据进入仓库的入口。
由于数据仓库是一个独立的数据环境,需要通过抽取过程将数据从联机事务处理系统、
外部数据源、脱机的数据存储介质中导入数据仓库。
数据抽取在技术上主要涉及互连、复制、增量、转 换、调度和监控等几个方面的处理。
在数据抽取方面,未来的技术发展将集中在系统功能集成化方面,
以适应数据仓 库本身或数据源的变化,使系统更便于管理和维护。

数据的存储和管理

数据仓库的组织管理方式决定了它有别于传统数据库的特性,也决定了其对外部数据的表现形式。
数据仓库管理 所涉及的数据量比传统事务处理大得多,且随时间的推移而快速累积。
在数据仓库的数据存储和管理中需要解决的是 如何管理大量的数据、
如何并行处理大量的数据、如何优化查询等。
目前,许多数据库厂家提供的技术解决方案是扩 展关系型数据库的功能,
将普通关系数据库改造成适合担当数据仓库的服务器。

数据的展现

在数据展现方面主要的方式有:
查询:实现预定义查询、动态查询、OLAP查询与决策支持智能查询;
报表:产生关系数据表格、复杂表格、OLAP表格、报告以及各种综合报表;
可视化:用易于理解的点线图、直方图、饼图、网状图、交互式可视化、

动态模拟、计算机动画技术表现复杂数据及其相互关系;
统计:进行平均值、最大值、最小值、期望、方差、汇总、排序 等各种统计分析;
挖掘:利用数据挖掘等方法,从数据中得到关于数据关系和模式的知识。