新一代企业级数据整合平台——SQL Server 2005


SQL Server 2005带来了一个全新的企业级数据整合平台。此平台具有出色的ETL和整合能力,使得组织机构能更加容易地管理来自于不同的关系型和非关系型数据源的数据。

 
通过SQL Server Integration Services(SSIS),组织机构能以整体的视角去考察它们的商业运营情况,从而能够更加具有竞争优势。

企业级数据整合平台

SQL Server Integration Services替代了SQL Server 2000中一个非常受欢迎的功能模块——数据转换服务(DTS)。但SSIS并不是DTS的简单升级,它是SQL Server 2005中的一个全新的组件,它提供了构建企业级数据整合应用程序所需的功能和性能。无论是在轻量级的32位系统中还是在高端的64位架构中,它的转换引擎的性能优势都是非常明显的。

  • 开发环境。用于快速开发SSIS包的、非常直观的开发界面被集成在Business Intelligence Development Studio中。在这个Studio中,你还可以构建与分析服务、报表服务共享的解决方案,包括源控制、元数据整合等。同时,这个Studio还是一个完整的商业智能应用程序的开发环境,在其中,你可以设计、测试、部署和维护端到端的商业智能应用程序。
  • 可视化调试。有了可视化调试的功能,开发人员的工作效率能够达到一个更高的水准。在Data Viewers中,设计人员能够非常清楚地看到数据管道的工作状况,它通过图表的形式来可视化数据的传输,同时,断点、变量和调用堆栈提供了非常强大的调试功能。
  • 数据连接。整合不同的数据源和数据目标变得非常容易。除了那些常见的数据源,例如文本文件、OLEDB和ADO.NET(包括针对.NET的ODBC),在SSIS中还简化了访问SAP中数据的方式。内置的对XML和Web Services的支持使得与面向服务的架构以及其他非标准数据源的整合变得非常轻松。用于数据装载的SQL Server数据目标经过了优化,甚至SQL Server Mobile数据库也能被直接定位。由于具有整合元数据的能力和可共享的解决方案,报表服务的报表或者分析服务的多维数据集都能通过SSIS管道直接读取。
  • 高效率转换。在SQL Server Integration Services中包含了许多非常有效的组件,例如数据和字符相互转化、计算列、用于分区和筛选的条件操作符、查找、排序、聚集以及合并。高级组件简化了其他复杂的操作,例如缓慢变化维度的装载等。对于某些自定义的需求,我们可以使用灵活和快速的VisualBasic.NET脚本来实现,同时,开发人员可以毫不费力地编写和分发他们自创的可重用组件。

点击查看大图

一个使用了Fuzzy Lookup的数据清洗的简单例子。

  • 数据质量和数据挖掘。针对于数据的质量,Fuzzy Lookup和Fuzzy Grouping组件提供了不精确匹配和消除重复数据的功能。数据挖掘功能通过训练已整合的数据得到模型,从而为数据整合流程带来新的能力。为了保证数据质量,可使用预测模型来避免数据的不完整和丢失,或者使用关联和聚集模型来找出异常的和不规则的数据。
  • 可靠性。包可以通过配置来定制其在不同情况下运行的方式,例如针对不同的服务器环境。使用数字签名来保证用于部署的包的安全性;运行一个简单的向导就能完成已部署包的安装;检查点重启和对事务的支持;加上WMI侦听器和灵活的异常处理、事件驱动功能保证无人值守运行的可复原性;与SQL Server Management Studio的集成简化了在SQL Server环境中对包的管理和监视。
  • Integration的意义。SQL Server Integration Services的意义不仅仅是在与整合数据。它的架构和基础结构使得能够在专门的软件提供商和特定的用户之间建立起非同寻常的、动态的和形式多样的交流方式。SQL Server Integration Services的基础结构是可以非常容易地进行扩展并且功能非常强大,软件提供商们可以非常容易地开发和分发他们制作的高级组件,与此同时,用户也能够尽情享受新想法、组件和技术支持的在微软及其合作伙伴间活跃交流所带来的各种益处。
本文作者:
« 
» 
快速导航

Copyright © 2016 phpStudy | 豫ICP备2021030365号-3