通过 Azure 门户开始使用 Azure Data Lake Analytics

重要

除非已启用订阅,否则无法再创建新的 Azure Data Lake Analytics 帐户。 如果需要启用订阅, 请联系支持人员 并提供业务方案。

如果已在使用 Azure Data Lake Analytics,则需要在 2024 年 2 月 29 日前为组织创建 到 Azure Synapse Analytics 的迁移计划

本文介绍如何使用 Azure 门户创建 Azure Data Lake Analytics 帐户、在 U-SQL 中定义作业,以及如何将作业提交到 Data Lake Analytics 服务。

先决条件

在开始本教程之前,必须拥有 Azure 订阅。 如果没有,可以按照此链接 获取 Azure 免费试用版

创建 Data Lake Analytics 帐户

现在,你将同时创建 Data Lake Analytics 和 Azure Data Lake Storage Gen1 帐户。 此步骤非常简单,只需大约 60 秒即可完成。

  1. 登录到 Azure 门户
  2. 选择“ 创建资源”,然后在页面顶部的搜索中输入 Data Lake Analytics
  3. 为以下项选择值:
    • 名称:命名 Data Lake Analytics 帐户(只允许小写字母和数字)。
    • 订阅:选择用于 Analytics 帐户的 Azure 订阅。
    • 资源组。 选择现有的 Azure 资源组或创建新资源组。
    • 位置。 选择 Azure 数据中心以用于 Data Lake Analytics 帐户。
    • Data Lake Storage Gen1:按照说明创建新的 Data Lake Storage Gen1 帐户,或选择现有帐户。
  4. (可选)为 Data Lake Analytics 帐户选择定价层。
  5. 选择“ 创建”。

第一个 U-SQL 脚本

以下文本是一个简单的 U-SQL 脚本。 它所做的就是在脚本中定义一个小数据集,然后将该数据集作为名为 /data.csv的文件写入默认 Data Lake Storage Gen1 帐户。

@a  = 
    SELECT * FROM 
        (VALUES
            ("Contoso", 1500.0),
            ("Woodgrove", 2700.0)
        ) AS 
              D( customer, amount );
OUTPUT @a
    TO "/data.csv"
    USING Outputters.Csv();

提交 U-SQL 作业

  1. 从 Data Lake Analytics 帐户中,选择“ 新建作业”。
  2. 粘贴上述 U-SQL 脚本的文本。 给职位命名。
  3. 选择 “提交 ”按钮以启动作业。
  4. 监视作业 的状态 ,并等待作业状态更改为 “成功”。
  5. 选择 “数据 ”选项卡,然后选择“ 输出 ”选项卡。选择命名 data.csv 的输出文件并查看输出数据。

另请参阅