Compartir a través de


NycTlcGreen Clase

Representa el conjunto de datos público nyc Taxi & Limousine Commission green taxi trip.

Los registros verdes de carreras de taxi incluyen campos que capturan fechas y horas de recogida y entrega, ubicaciones de recogida y entrega, distancias de viaje, tarifas desglosadas, tipos de tarifas, tipos de pago y recuentos de pasajeros notificados por el conductor. Para obtener más información sobre este conjunto de datos, incluidas las descripciones de columnas, diferentes formas de acceder al conjunto de datos y ejemplos, consulte NYC Taxi & Limousine Commission - green taxi trip records in the Microsoft Azure Open Datasets catalog.

Para obtener un ejemplo del uso de la clase NycTlcGreen, consulte el tutorial Uso del aprendizaje automático automatizado para predecir tarifas de taxi.

Inicialice los campos de filtrado.

Constructor

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parámetros

Nombre Description
start_date

Fecha en la que se empiezan a cargar datos, ambos incluidos. Si No, default_start_date se usa .

Valor predeterminado: 2015-01-01 00:00:00
end_date

Fecha en la que se van a finalizar la carga de datos, ambos incluidos. Si No, default_end_date se usa .

Valor predeterminado: 2024-12-13 00:00:00
cols

Lista de nombres de columnas que se van a cargar desde el conjunto de datos. Si es None, se cargan todas las columnas. Para obtener información sobre las columnas disponibles en este conjunto de datos, consulte NYC Taxi & Limousine Commission - green taxi trip records.

Valor predeterminado: None
limit
int

Valor que indica el número de días de datos que se van a cargar con to_pandas_dataframe(). Si no se especifica, el valor predeterminado de -1 significa que no hay ningún límite en días cargados.

Valor predeterminado: -1
enable_telemetry

Si se va a habilitar la telemetría en este conjunto de datos.

Valor predeterminado: True
start_date
Requerido

La fecha de inicio que desea consultar de forma inclusiva.

end_date
Requerido

Fecha de finalización que desea consultar de forma inclusiva.

cols
Requerido

Lista de nombres de columna que desea recuperar. Ninguno obtendrá todas las columnas.

limit
Requerido
int

to_pandas_dataframe() solo cargará los meses de datos de "límite". -1 significa que no hay límite.

enable_telemetry
Requerido

Indica si se va a enviar telemetría.

Comentarios

En el ejemplo siguiente se muestra cómo acceder al conjunto de datos.


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()