数据挖掘的预测任务


数据挖掘通常被称为“从大型数据库提取有效、可行信息的过程”。换言之,数据挖掘帮助您发现数据中存在的模式和趋势。Microsoft SQL Server Analysis Services 为提取和分析这些模式提供了强大的数据挖掘功能和工具。Integration Services 还提供了许多组件,帮助您管理和查询这些数据挖掘模型。

  注意:
  本主题所介绍的部分 Integration Services 组件仅在 SQL Server 的 Enterprise Edition 和 Developer Edition 中可用。

  连接管理器
  连接管理器是与数据源所进行的连接的逻辑表示形式。使用 Analysis Services 连接管理器可以连接到存储挖掘结构和模型的 Analysis Services 数据库。本主题中介绍的所有任务和数据流组件都需要使用 Analysis Services 连接管理器。

  Analysis Services 连接管理器
  Analysis Services 连接管理器使包能够连接到运行 Analysis Services 数据库的服务器,或连接到用于访问挖掘结构和挖掘模型的 Analysis Services 项目。在 Business Intelligence Development Studio 中开发包时,仅可连接到 Analysis Services 项目。在运行时,包会连接到您已部署 Analysis Services 的服务器和数据库。

  任务
  任务是一些控制流元素,它定义包中执行的工作单元。使用下列任务可以创建或修改数据挖掘结构或模型,还可以处理或查询模型。

  Analysis Services 执行 DDL 任务
  Analysis Services 执行 DDL 任务运行可以创建、删除或更改挖掘结构和模型的数据定义语言 (DDL) 语句。DDL 语句表示为 Analysis Services 脚本语言 (ASSL) 中的语句,并嵌入 XML for Analysis (XMLA) 命令中。

  Analysis Services 处理任务
  Analysis Services 处理任务可使 Analysis Services 对象(如挖掘模型)的处理实现自动化。

  数据挖掘查询任务
  数据挖掘查询任务根据 Analysis Services 内置的数据挖掘模型运行预测查询。预测查询通过使用挖掘模型来创建对新数据的预测,并将其输出保存到一个或多个表中。

  数据流转换
  转换是包的数据流中对数据进行聚合、合并、分发和修改的组件。

  数据挖掘查询转换
  数据挖掘查询转换针对数据挖掘模型执行预测查询。此转换包含用于创建数据挖掘扩展 (DMX) 查询的查询生成器。通过查询生成器可使用 DMX 语言创建自定义语句,来针对现有挖掘模型计算转换输入数据。与将输出直接保存到一个或多个表中的数据挖掘查询任务不同,数据挖掘查询转换使其输出可供包数据流中的下游组件使用。

  数据流目标
  目标是将数据流中的输出加载到不同类型的数据源或创建内存中数据集的数据流组件。

  数据挖掘模型定型目标
  数据挖掘模型定型目标将该目标接收到的数据通过数据挖掘模型算法传递,从而为数据挖掘模型定型。在定型过程中,该算法将计算数据中元素的模式及相互关系。对新挖掘模型定型后,可以使用该模型来运行预测查询。

  用于数据挖掘的其他 Integration Services 组件
  Integration Services 还有许多其他组件可用于数据挖掘解决方案的一部分。

  若要使用数据子集来定型或测试数据挖掘模型,您可以使用:

  行抽样转换:只根据您指定的计数复制行的子集。

  百分比抽样转换:只根据您指定的百分比复制行的子集。

  若要通过删除重复值和标准化值来清除数据,可以使用:

  排序转换:对数据排序时删除重复行。

  模糊分组转换:根据相似性而不是完全匹配对行分组。

  模糊查找转换:根据相似性而不是完全匹配在引用表中查找匹配。

  若要执行文本挖掘,可以使用:

  字词提取转换:在筛选出标准干扰词和用户定义的干扰词后,为在源中发现的字词创建一个表。

  字词查找转换:将输入的字词与引用表中的字词进行匹配。


« 
» 
快速导航

Copyright © 2016 phpStudy | 豫ICP备2021030365号-3