Excel 源

Excel 源从 Microsoft Excel 工作簿的工作表或范围中提取数据。

Excel 源提供了四种提取数据的数据访问方式:

  • 表或视图。

  • 变量中指定的表或视图。

  • SQL 语句的结果。 查询可以是参数化查询。

  • 存储在变量中的 SQL 语句的结果。

重要

在 Excel 中,工作表或区域等效于表格或视图。 Excel 源和目标编辑器中的可用表列表显示现有工作表(由附加在工作表名称后面的 $ 符号标识,如 Sheet1$)和命名区域(由未附加 $ 符号标识,如 MyRange)。 有关详细信息,请参阅“使用注意事项”部分。

Excel 源使用 Excel 连接管理器与数据源建立连接,连接管理器可指定要使用的工作簿文件。 有关详细信息,请参阅 Excel Connection Manager

Excel 源有一个常规输出和一个错误输出。

使用注意事项

Excel 连接管理器使用 Microsoft OLE DB Provider for Jet 4.0 及其支持的 Excel ISAM(索引顺序访问方法)驱动程序来连接和读取和写入 Excel 数据源的数据。

许多现有Microsoft知识库文章都记录了此提供程序和驱动程序的行为,尽管这些文章并不特定于 Integration Services 或其前置数据转换服务,但你可能想要了解可能导致意外结果的某些行为。 有关 Excel 驱动程序的使用和行为的一般信息,请参阅 HOWTO:将 ADO 与 Visual Basic 或 VBA 中的 Excel 数据配合使用

使用 Excel 驱动程序的 Jet 提供程序的以下行为可能会导致从 Excel 数据源读取数据时出现意外结果。

  • 数据源。 Excel 工作簿中的数据源可以是工作表,必须追加 $ 符号(例如 Sheet1$)或命名区域(例如 MyRange)。 在 SQL 语句中,工作表的名称必须分隔(例如 [Sheet1$]),以避免由 $ 符号导致的语法错误。 查询生成器会自动添加这些分隔符。 指定工作表或区域时,驱动程序读取从工作表或区域左上角的第一个非空单元格开始的连续单元格块。 因此,源数据中不能有空行,也不能在标题行或表头行与数据行之间有空行。

  • 缺少值。 Excel 驱动程序读取指定源中的特定行数(默认情况下为 8 行),以猜测每列的数据类型。 如果推测出列可能包含混合数据类型(尤其是混合了文本数据的数值数据时),驱动程序将决定采用占多数的数据类型,并对包含其他类型数据的单元返回 Null 值。 (如果各种数据类型的数量相当,则采用数值类型。)Excel 工作表中大部分单元格格式设置选项不会影响此数据类型判断。 可以通过指定导入模式来修改 Excel 驱动程序的此行为。 若要指定导入模式,请在 属性窗口中,将 IMEX=1 添加到 Excel 连接管理器的连接字符串中的扩展属性的值。 有关详细信息,请参阅 PRB:使用 DAO OpenRecordset 返回为 NULL 的 Excel 值

  • 截断的文本。 驱动程序在确定 Excel 列是否包含文本数据时,它将基于采样的最长值来选择数据类型(字符串或 memo)。 如果驱动程序没有在其采样的行中发现任何长于 255 个字符的值,那么它会将该列视为 255 个字符的字符串的列而不是 memo 列。 因此,长度超过 255 个字符的值可能会被截断。 若要在不截断的情况下从备注列导入数据,必须确保至少一个采样行中的备注列包含的值超过 255 个字符,或者必须增加驱动程序采样的行数以包含此类行。 可以通过在 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Jet\4.0\Engines\Excel 注册表项下增加 TypeGuessRows 的值来增加采样的行数。 有关详细信息,请参阅 PRB:从 Jet 4.0 OLEDB 源传输数据失败,出现错误

  • 数据类型。 Excel 驱动程序只识别有限的一组数据类型。 例如,所有数值列均解释为双精度 (DT_R8),并且所有字符串列(除了 memo 列)均解释为 255 个字符的 Unicode 字符串 (DT_WSTR)。 Integration Services 按如下所示映射 Excel 数据类型:

    • 数值 - 双精度浮点 (DT_R8)

    • 货币 - 货币 (DT_CY)

    • 布尔 - 布尔 (DT_BOOL)

    • 日期/时间 - datetime (DT_DATE)

    • 字符串 - Unicode 字符串,长度为 255 (DT_WSTR)

    • Memo - Unicode 文本流 (DT_NTEXT)

  • 数据类型和长度转换。 Integration Services 不会隐式转换数据类型。 因此,在将 Excel 数据加载到非 Excel 目标之前,可能需要使用派生列或数据转换转换显式转换 Excel 数据,或者在将数据加载到 Excel 目标之前转换非 Excel 数据。 在这种情况下,使用导入和导出向导创建初始包可能很有用,该向导会为你配置必要的转换。 可能需要转换的一些示例包括:

    • Unicode Excel 字符串列与具有特定代码页的非 Unicode 字符串列之间的转换

    • 在 255 个字符的 Excel 字符串列和长度不同的字符串列之间进行转换

    • Excel 双精度数值列与其他类型数值列之间的转换

Excel 源配置

可以通过 SSIS 设计器或以编程方式来设置属性。

有关可在 Excel 源编辑器 对话框中设置的属性的详细信息,请单击以下主题之一:

“高级编辑器” 对话框反映了所有能以编程方式设置的属性。 有关可以在 “高级编辑器” 对话框中或以编程方式设置的属性的详细信息,请单击下列主题之一:

有关循环遍历 Excel 文件中的某个组的信息,请参阅 使用 Foreach 循环容器,循环遍历 Excel 文件和表