次の方法で共有


PublicHolidaysOffline クラス

祝日オフラインパブリック データセットを表します。

行の詳細については、Microsoft Azure Open Datasets カタログの 祝日 を参照してください。

フィルター フィールドを初期化します。

コンストラクター

PublicHolidaysOffline(country_or_region: str = 'US', start_date: datetime = datetime.datetime(1970, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2099, 1, 1, 0, 0), cols: List[str] | None = None, enable_telemetry: bool = True)

パラメーター

名前 説明
country_or_region
str

データを返す国または地域。

規定値: US
start_date

データの読み込みを開始する日付 (両端を含む)。 None の場合、 default_start_date が使用されます。

規定値: 1970-01-01 00:00:00
end_date

データの読み込みを終了する日付 (両端を含む)。 None の場合、 default_end_date が使用されます。

規定値: 2099-01-01 00:00:00
cols

データセットから読み込む列名の一覧。 None の場合、すべての列が読み込まれます。 このデータセットで使用できる列の詳細については、「 祝日」を参照してください。

規定値: None
enable_telemetry

このデータセットでテレメトリを有効にするかどうか。

規定値: True
country_or_region
必須
str

クエリを実行する国または地域。

start_date
必須

包括的にクエリを実行する開始日。

end_date
必須

包括的にクエリを実行する終了日。

cols
必須

取得する列名の一覧。 なしはすべての列を取得します。

enable_telemetry
必須

テレメトリを送信するかどうかを示します。

注釈

次の例は、データセットにアクセスする方法を示しています。


   from azureml.opendatasets import PublicHolidaysOffline
   from datetime import datetime
   from dateutil.relativedelta import relativedelta

   end_date = datetime.today()
   start_date = datetime.today() - relativedelta(months=1)
   hol = PublicHolidaysOffline(start_date=start_date, end_date=end_date)
   hol_df = hol.to_pandas_dataframe()

メソッド

filter

フィルター時間。

get_holidays_dates

休日の日付のキーでディクトを取得します。

get_holidays_in_range

指定された日付範囲に基づく休日情報の一覧を取得します。

get_holidays_in_range_by_country_or_region

指定された日付範囲に基づく休日情報の一覧を取得します。

get_pandas_limit

pandas データ読み込み制限クラスのインスタンスを取得します。

is_holiday

日付が休日かどうかを検出します。

is_holiday_by_country_or_region

日付が休日かどうかを検出します。

filter

フィルター時間。

filter(env: SparkEnv | PandasEnv, min_date: datetime, max_date: datetime)

パラメーター

名前 説明
env
必須

ランタイム環境。

min_date
必須

最小日付。

max_date
必須

最大日付。

戻り値

説明

フィルター処理されたデータ フレーム。

get_holidays_dates

休日の日付のキーでディクトを取得します。

get_holidays_dates(country_code: str | None = None, country_or_region: str | None = None) -> Dict[datetime, None] | None

パラメーター

名前 説明
country_code

チェックに使用する国/地域の休日情報を指定します。

規定値: None
country_or_region

チェックに使用する国/地域の休日情報を指定します。

規定値: None

戻り値

説明

キーとして休日の日付を指定し、値として None を指定したディクテーション。

get_holidays_in_range

指定された日付範囲に基づく休日情報の一覧を取得します。

get_holidays_in_range(start_date: date, end_date: date, country_code: str = 'US') -> DataFrame

パラメーター

名前 説明
start_date
必須

日付範囲の開始日。

end_date
必須

日付範囲の終了日。

country_code

チェックに使用する国/地域の休日情報を指定します。

規定値: US

戻り値

説明

ターゲットの日付範囲の休日を含む DataFrame。

get_holidays_in_range_by_country_or_region

指定された日付範囲に基づく休日情報の一覧を取得します。

get_holidays_in_range_by_country_or_region(start_date: date, end_date: date, country_or_region: str = 'United States') -> DataFrame

パラメーター

名前 説明
start_date
必須

日付範囲の開始日。

end_date
必須

日付範囲の終了日。

country_or_region

チェックに使用する国/地域の休日情報を指定します。

規定値: United States

戻り値

説明

ターゲットの日付範囲の休日を含む DataFrame。

get_pandas_limit

pandas データ読み込み制限クラスのインスタンスを取得します。

get_pandas_limit()

is_holiday

日付が休日かどうかを検出します。

is_holiday(target_date: date, country_code: str = 'US') -> bool

パラメーター

名前 説明
target_date
必須

チェックする必要がある日付。

country_code

チェックに使用する国/地域の休日情報を指定します。

規定値: US

戻り値

説明

target_dateが休日かどうか。 True または False です。

is_holiday_by_country_or_region

日付が休日かどうかを検出します。

is_holiday_by_country_or_region(target_date: date, country_or_region: str = 'United States') -> bool

パラメーター

名前 説明
target_date
必須

チェックする必要がある日付。

country_or_region

チェックに使用する国/地域の休日情報を指定します。

規定値: United States

戻り値

説明

target_dateが休日かどうか。 True または False です。

属性

HOLIDAYS_DF

HOLIDAYS_DF = countryOrRegion  ... isPaidTimeOff 0              Denmark  ...          None 1              Belgium  ...          None 2          Netherlands  ...          None 3              Croatia  ...          None 4                Czech  ...          None ...                ...  ...           ... 344981         Croatia  ...          None 344982          Norway  ...          None 344983          Sweden  ...          None 344984          Sweden  ...          None 344985          Norway  ...          None  [344986 rows x 5 columns]

data

data = None

default_country_or_region

default_country_or_region = 'US'

default_end_date

default_end_date = datetime.datetime(2099, 1, 1, 0, 0)

default_start_date

default_start_date = datetime.datetime(1970, 1, 1, 0, 0)