NycTlcGreen Clase
Representa el conjunto de datos público nyc Taxi & Limousine Commission green taxi trip.
Los registros verdes de carreras de taxi incluyen campos que capturan fechas y horas de recogida y entrega, ubicaciones de recogida y entrega, distancias de viaje, tarifas desglosadas, tipos de tarifas, tipos de pago y recuentos de pasajeros notificados por el conductor. Para obtener más información sobre este conjunto de datos, incluidas las descripciones de columnas, diferentes formas de acceder al conjunto de datos y ejemplos, consulte NYC Taxi & Limousine Commission - green taxi trip records in the Microsoft Azure Open Datasets catalog.
Para obtener un ejemplo del uso de la clase NycTlcGreen, consulte el tutorial Uso del aprendizaje automático automatizado para predecir tarifas de taxi.
Inicialice los campos de filtrado.
Constructor
NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
Parámetros
Nombre | Description |
---|---|
start_date
|
Fecha en la que se empiezan a cargar datos, ambos incluidos. Si No, Valor predeterminado: 2015-01-01 00:00:00
|
end_date
|
Fecha en la que se van a finalizar la carga de datos, ambos incluidos. Si No, Valor predeterminado: 2024-12-13 00:00:00
|
cols
|
Lista de nombres de columnas que se van a cargar desde el conjunto de datos. Si es None, se cargan todas las columnas. Para obtener información sobre las columnas disponibles en este conjunto de datos, consulte NYC Taxi & Limousine Commission - green taxi trip records. Valor predeterminado: None
|
limit
|
Valor que indica el número de días de datos que se van a cargar con Valor predeterminado: -1
|
enable_telemetry
|
Si se va a habilitar la telemetría en este conjunto de datos. Valor predeterminado: True
|
start_date
Requerido
|
La fecha de inicio que desea consultar de forma inclusiva. |
end_date
Requerido
|
Fecha de finalización que desea consultar de forma inclusiva. |
cols
Requerido
|
Lista de nombres de columna que desea recuperar. Ninguno obtendrá todas las columnas. |
limit
Requerido
|
to_pandas_dataframe() solo cargará los meses de datos de "límite". -1 significa que no hay límite. |
enable_telemetry
Requerido
|
Indica si se va a enviar telemetría. |
Comentarios
En el ejemplo siguiente se muestra cómo acceder al conjunto de datos.
from azureml.opendatasets import NycTlcGreen
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()