PublicHolidays 类
表示公共假日公共数据集。
此数据集包含来自 PyPI 假日套餐和维基百科的全球公共假日数据,涵盖从 1970 年到 2099 年 38 个国家和地区。 每行指示特定日期、国家或地区的假日信息,以及大多数人是否带薪休假。 有关此数据集的详细信息,包括列说明、访问数据集的不同方式和示例,请参阅 azure 开放数据集目录中Microsoft 公共假日 。
初始化筛选字段。
构造函数
PublicHolidays(country_or_region: str = '', start_date: datetime = datetime.datetime(2008, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, enable_telemetry: bool = True)
参数
名称 | 说明 |
---|---|
country_or_region
必需
|
要为其返回数据的国家或地区。 |
start_date
|
开始加载数据的日期(含)。 如果为 None, 默认值: 2008-01-01 00:00:00
|
end_date
|
结束加载数据的日期(含)。 如果为 None, 默认值: 2024-12-13 00:00:00
|
cols
|
要从数据集加载的列名称列表。 如果为 None,则加载所有列。 有关此数据集中可用列的信息,请参阅 公共假日。 默认值: None
|
enable_telemetry
|
是否为此数据集启用遥测。 默认值: True
|
country_or_region
必需
|
要查询的国家或地区。 |
start_date
必需
|
要进行非独占查询的开始日期。 |
end_date
必需
|
要进行非独占查询的结束日期。 |
cols
必需
|
要检索的列名列表。 无将获取所有列。 |
enable_telemetry
必需
|
指示是否发送遥测数据。 |
注解
下面的示例演示如何访问数据集。
from azureml.opendatasets import PublicHolidays
from datetime import datetime
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
方法
filter |
筛选时间。 |
filter
筛选时间。
filter(env: SparkEnv | PandasEnv, min_date: datetime, max_date: datetime)
参数
名称 | 说明 |
---|---|
env
必需
|
运行时环境。 |
min_date
必需
|
最小日期。 |
max_date
必需
|
最大日期。 |
返回
类型 | 说明 |
---|---|
筛选的数据帧。 |
属性
country_or_region_column_name
country_or_region_column_name = 'countryOrRegion'
countrycode_column_name
countrycode_column_name = 'countryRegionCode'
default_end_date
default_end_date = datetime.datetime(2024, 12, 13, 0, 0)
default_max_end_date
default_max_end_date = datetime.datetime(2099, 1, 1, 0, 0)
default_start_date
default_start_date = datetime.datetime(2008, 1, 1, 0, 0)