使用用于 Visual Studio 的 Data Lake 工具开发 U-SQL 脚本

重要

除非已启用订阅,否则无法再创建新的 Azure Data Lake Analytics 帐户。 如果您需要激活订阅,联系支持人员 并提供您的业务场景。

如果已在使用 Azure Data Lake Analytics,则需要在 2024 年 2 月 29 日为组织创建到 Azure Synapse Analytics 迁移计划。

Azure Data Lake 和流分析工具包括与两个 Azure 服务、Azure Data Lake Analytics 和 Azure 流分析相关的功能。 有关 Azure 流分析方案的详细信息,请参阅 适用于 Visual Studio 的 Azure 流分析工具

本文介绍如何使用 Visual Studio 创建 Azure Data Lake Analytics 帐户。 可以在 U-SQL 中定义作业,并将作业提交到 Data Lake Analytics 服务。 有关 Data Lake Analytics 的详细信息,请参阅 Azure Data Lake Analytics 概述

重要

建议升级到适用于 Visual Studio 的 Azure Data Lake 工具 2.3.3000.4 或更高版本。 以前的版本不再可供下载,现已弃用。

  1. 检查您使用的 Azure Data Lake Tools for Visual Studio 版本是否早于 2.3.3000.4。

    检查工具版本

  2. 如果版本是 2.3.3000.4 的早期版本,请访问下载中心更新适用于 Visual Studio 的 Azure Data Lake 工具:

先决条件

安装用于 Visual Studio 的 Azure Data Lake 工具

本教程要求安装用于 Visual Studio 的 Data Lake 工具。 有关详细信息,请参阅 安装用于 Visual Studio 的 Data Lake 工具

连接到 Azure Data Lake Analytics 帐户

  1. 打开 Visual Studio。

  2. 打开Data Lake Analytics 资源管理器,方法是选择查看>Data Lake Analytics 资源管理器

  3. 右键单击 Azure,然后选择“ 连接到”Microsoft Azure 订阅。 在 登录到您的帐户,请按照说明进行操作。

  4. 服务器资源管理器中,选择 Azure>Data Lake Analytics。 可以看到 Data Lake Analytics 帐户的列表。

编写第一个 U-SQL 脚本

以下文本是一个简单的 U-SQL 脚本。 它定义一个小数据集,并将该数据集作为名为 /data.csv 的文件写入默认 Data Lake Store。

USE DATABASE master;
USE SCHEMA dbo;
@a  = 
    SELECT * FROM 
        (VALUES
            ("Contoso", 1500.0),
            ("Woodgrove", 2700.0)
        ) AS 
              D( customer, amount );
OUTPUT @a
    TO "/data.csv"
    USING Outputters.Csv();

提交 Data Lake Analytics 作业

  1. 在 Visual Studio 中,选择“文件”>“新建”>“项目”

  2. 选择 U-SQL 项目 类型,然后选择“ 下一步”。 在 “配置新项目”中,选择“ 创建”。

    Visual Studio 创建包含 Script.usql 文件的解决方案。

  3. 将脚本从 “编写第一个 U-SQL 脚本 ”粘贴到 Script.usql 窗口中。

  4. 解决方案资源管理器中,右键单击 Script.usql,然后选择“ 提交脚本”。

  5. “提交作业”中,选择 Data Lake Analytics 帐户,然后选择“ 提交”。

    提交 U-SQL Visual Studio 项目

作业提交后,“ 作业视图 ”选项卡将打开以显示作业进度。

  • 作业摘要 显示作业的摘要。
  • 作业图 直观显示作业的进度。
  • 元数据操作 显示在 U-SQL 目录上进行的所有操作。
  • 数据显示 所有输入和输出。
  • 状态历史记录 显示时间线和状态详细信息。
  • AU 分析 显示作业中使用的 AU(分析单元)数量,并探索不同 AU 分配策略的模拟。
  • 诊断 为作业执行和性能优化提供了高级分析。

U-SQL Visual Studio Data Lake Analytics 作业性能图

若要查看最新的作业状态并刷新屏幕,请选择“ 刷新”。

检查作业状态

  1. Data Lake Analytics 资源管理器中,选择 Data Lake Analytics

  2. 扩展 Data Lake Analytics 帐户名称。

  3. 双击职位

  4. 选择之前提交的任务。

查看作业输出

  1. Data Lake Analytics 浏览器中,浏览到您提交的作业。

  2. 选择作业中的 “数据 ”选项卡。

  3. 在“ 作业输出 ”选项卡中,选择 "/data.csv" 该文件。

后续步骤