NycTlcGreen クラス
NYC タクシー & リムジン委員会のグリーン タクシー乗車のパブリック データセットを表します。
緑色のタクシー乗車レコードには、乗車日時と降車日/時刻をキャプチャするフィールド、乗車場所と降車場所、乗車距離、明細化された運賃、料金の種類、支払いの種類、ドライバーから報告された乗客数が含まれます。 列の説明、データセットにアクセスするさまざまな方法、例など、このデータセットの詳細については、「 NYC タクシーとリムジン委員会 - Microsoft Azure Open Datasets カタログの緑色のタクシー乗車レコード」を参照してください。
NycTlcGreen クラスの使用例については、「 自動機械学習を使用してタクシー料金を予測する」チュートリアルを参照してください。
フィルター フィールドを初期化します。
コンストラクター
NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
パラメーター
名前 | 説明 |
---|---|
start_date
|
データの読み込みを開始する日付 (両端を含む)。 None の場合、 規定値: 2015-01-01 00:00:00
|
end_date
|
データの読み込みを終了する日付 (両端を含む)。 None の場合、 規定値: 2024-12-13 00:00:00
|
cols
|
データセットから読み込む列名の一覧。 None の場合、すべての列が読み込まれます。 このデータセットで使用可能な列の詳細については、「 NYC タクシー & リムジン委員会 - グリーン タクシー乗車記録」を参照してください。 規定値: None
|
limit
|
規定値: -1
|
enable_telemetry
|
このデータセットでテレメトリを有効にするかどうか。 規定値: True
|
start_date
必須
|
包括的にクエリを実行する開始日。 |
end_date
必須
|
包括的にクエリを実行する終了日。 |
cols
必須
|
取得する列名の一覧。 なしはすべての列を取得します。 |
limit
必須
|
to_pandas_dataframe() は、データの "制限" 月のみを読み込みます。 -1 は制限がないことを意味します。 |
enable_telemetry
必須
|
テレメトリを送信するかどうかを示します。 |
注釈
次の例は、データセットにアクセスする方法を示しています。
from azureml.opendatasets import NycTlcGreen
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()