适用于: Databricks SQL
Databricks Runtime 10.4 LTS 及更高版本
仅限 Unity Catalog
INFORMATION_SCHEMA
是一个基于 SQL 标准版的架构,在 Unity Catalog 上创建的每个目录中都提供。
在信息架构中,可以找到一组视图,这些视图描述了你有权查看的架构目录已知的对象。
SYSTEM
目录的信息架构返回有关元存储中所有目录的对象的信息。 信息架构系统表不包含有关 hive_metastore
对象的元数据。
信息架构的目的是为元数据提供基于 SQL 的自描述 API。
信息架构的实体关系图
下面的实体关系 (ER) 图概述了一部分信息架构视图以及这些视图相互关联的方式。
信息架构视图
说明
- 将某些目录元数据的更改反映在信息架构中可能需要使用
REPAIR TABLE
手动同步。 有关详细信息,请参阅 REPAIR TABLE。 - 除列名和标记名称 之外 的所有标识符都以小写
STRING
形式存储在信息架构中。 为提高查询性能,请避免使用类似LOWER()
或UPPER()
标识符列的函数。 相反,使用小写值直接比较标识符。 - 若要防止查询超时,在查询信息架构时应用选择性筛选器(例如
WHERE table_catalog = 'main' AND table_schema = 'default'
)。 有关可用作每个信息架构表的筛选器的列的完整列表,请参阅上面的文档。- 请注意,当前不支持
LIMIT
下推,因此尽管它可以截断结果,但不会提高性能。
- 请注意,当前不支持
示例
> SELECT table_name, column_name
FROM information_schema.columns
WHERE data_type = 'DOUBLE'
AND table_schema = 'information_schema';
下面是使用系统级别信息架构表的工作流示例。
如果要查看在过去 24 小时内创建的所有表,查询可能如下所示。
> SELECT table_name, table_owner, created_by, last_altered, last_altered_by, table_catalog
FROM system.information_schema.tables
WHERE datediff(now(), last_altered) < 1;
如果要查看每个架构中有多少个表,请考虑以下示例。
> SELECT table_schema, count(table_name)
FROM system.information_schema.tables
WHERE table_schema = 'tpch'
GROUP BY table_schema
ORDER BY 2 DESC
相关文章
- SHOW
- 描述