Compartir a través de


NycTlcYellow Clase

Representa el conjunto de datos público nyc taxi & Limousine Commission.

Los registros amarillos de carreras de taxi incluyen campos que capturan fechas y horas de recogida y entrega, ubicaciones de recogida y entrega, distancias de viaje, tarifas desglosadas, tipos de tarifas, tipos de pago y recuentos de pasajeros notificados por el conductor. Para obtener más información sobre este conjunto de datos, incluidas las descripciones de columnas, diferentes formas de acceder al conjunto de datos y ejemplos, consulte NYC Taxi & Limousine Commission - yellow taxi trip records in the Microsoft Azure Open Datasets catalog.

Inicialice los campos de filtrado.

Constructor

NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parámetros

Nombre Description
start_date

Fecha en la que se empiezan a cargar datos, ambos incluidos. Si No, default_start_date se usa .

Valor predeterminado: 2015-01-01 00:00:00
end_date

Fecha en la que se van a finalizar la carga de datos, ambos incluidos. Si No, default_end_date se usa .

Valor predeterminado: 2024-12-13 00:00:00
cols

Lista de nombres de columnas que se van a cargar desde el conjunto de datos. Si es None, se cargan todas las columnas. Para obtener información sobre las columnas disponibles en este conjunto de datos, consulte NYC Taxi & Limousine Commission - yellow taxi trip records.

Valor predeterminado: None
limit
int

Valor que indica el número de días de datos que se van a cargar con to_pandas_dataframe(). Si no se especifica, el valor predeterminado de -1 significa que no hay ningún límite en días cargados.

Valor predeterminado: -1
enable_telemetry

Si se va a habilitar la telemetría en este conjunto de datos.

Valor predeterminado: True
start_date
Requerido

La fecha de inicio que desea consultar de forma inclusiva.

end_date
Requerido

Fecha de finalización que desea consultar de forma inclusiva.

cols
Requerido

Lista de nombres de columna que desea recuperar. Ninguno obtendrá todas las columnas.

limit
Requerido
int

to_pandas_dataframe() solo cargará los meses de datos de "límite". -1 significa que no hay límite.

enable_telemetry
Requerido

Indica si se va a enviar telemetría.

Comentarios

En el ejemplo siguiente se muestra cómo acceder al conjunto de datos.


   from azureml.opendatasets import NycTlcYellow
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()