İçeriğe geç

Ultralytics HUB-SDK ile Veri Kümesi Yönetimi

Ultralytics HUB-SDK Veri Kümesi Yönetimi belgelerine hoş geldiniz! 👋

Verimli veri kümesi yönetimi, makine öğreniminde çok önemlidir. İster deneyimli bir veri bilimcisi olun, ister yeni başlayan biri, veri kümesi işlemlerini nasıl yöneteceğinizi bilmek iş akışınızı kolaylaştırabilir. Bu sayfa, Ultralytics HUB-SDK'yı python'da kullanarak veri kümelerinde işlem gerçekleştirmenin temellerini kapsar. Sağlanan örnekler, veri kümelerini nasıl alacağınızı, oluşturacağınızı, güncelleyeceğinizi, sileceğinizi ve listeleyeceğinizi ve ayrıca veri kümesi erişimi için bir URL'yi nasıl alacağınızı ve veri kümelerini nasıl yükleyeceğinizi gösterir.

Hadi dalalım! 🚀

Kimliğe Göre Veri Kümesi Al

Benzersiz kimliğini kullanarak belirli bir veri kümesini hızla getirmek için aşağıdaki kod parçasını kullanın. Bu, verileri de dahil olmak üzere temel bilgilere erişmenizi sağlar.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Fetch a dataset by ID
dataset = client.dataset("<Dataset ID>")  # Replace with your actual Dataset ID
print(dataset.data)  # This prints the dataset information

Daha fazla detay için Datasets sınıfı ve yöntemleri için bkz. Şunun için referans hub_sdk/modules/datasets.py.

Bir Veri Kümesi Oluşturun

Yeni bir veri kümesi oluşturmak için, veri kümeniz için uygun bir ad tanımlayın ve şunu kullanın: create_dataset metodu aşağıda gösterildiği gibi:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define your dataset properties
data = {"meta": {"name": "My Dataset"}}  # Replace 'My Dataset' with your desired dataset name

# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")

Şuna bakın: create_dataset daha fazla bilgi için API referansındaki metodu inceleyin.

Veri Kümesini Güncelleme

Projeler geliştikçe, veri kümenizin meta verilerini değiştirmeniz gerekebilir. Bu, yeni ayrıntılarla aşağıdaki kodu çalıştırmak kadar basittir:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Obtain the dataset
dataset = client.dataset("<Dataset ID>")  # Insert the correct Dataset ID

# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}})  # Modify 'Updated Name' as required
print("Dataset updated with new information.")

update metodu, veri kümelerini güncelleme hakkında daha fazla ayrıntı sağlar.

Veri Kümesini Sil

Çalışma alanınızı düzenlemek veya artık ihtiyaç duyulmadığı için bir veri kümesini kaldırmak için şunu çağırarak kalıcı olarak silebilirsiniz: delete yöntem:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset by its ID
dataset = client.dataset("<Dataset ID>")  # Ensure the Dataset ID is specified

# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")

Sabit silmeler de dahil olmak üzere silme seçenekleri hakkında daha fazla bilgi için delete metot dokümantasyonu.

Veri Kümelerini Listeleme

Veri kümelerinize göz atmak için, tüm veri kümelerinizi sayfalama ile listeleyin. Bu, çok sayıda veri kümesiyle uğraşırken faydalıdır.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Retrieve the first page of datasets
datasets = client.dataset_list(page_size=10)
print("Current dataset:", datasets.results)  # Show the datasets on the current page

# Move to the next page and show results
datasets.next()
print("Next page result:", datasets.results)

# Go back to the previous page
datasets.previous()
print("Previous page result:", datasets.results)

DatasetList sınıfı, veri kümelerini listeleme ve sayfalandırma hakkında daha fazla ayrıntı sağlar.

Depolamadan URL Al

Bu işlev, veri kümesi depolama erişimi için bir URL getirerek, uzaktan depolanan veri kümesi dosyalarını veya yapıtlarını indirmeyi kolaylaştırır.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define the dataset ID for which you want a download link
dataset = client.dataset("<Dataset ID>")  # Replace Dataset ID with the actual dataset ID

# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)

get_download_link metot dokümantasyonu ek ayrıntılar sağlar.

Veri Kümesi Yükleme

Veri kümenizi yüklemek basittir. Veri kümenizin kimliğini ve dosya yolunu ayarlayın, ardından şunu kullanın: upload_dataset işlevi:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset
dataset = client.dataset("<Dataset ID>")  # Substitute with the real dataset ID

# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>")  # Specify the correct file path
print("Dataset has been uploaded.")

upload_dataset metodu, veri kümelerini yükleme hakkında daha fazla ayrıntı sağlar. Ayrıca ilgili hakkında da bilgi edinebilirsiniz DatasetUpload sınıfı.

Her şeyin sorunsuz çalıştığından emin olmak için Veri Kümesi Kimliklerinizi ve dosya yollarınızı iki kez kontrol etmeyi unutmayın.

Herhangi bir sorunla karşılaşırsanız veya sorularınız olursa, destek ekibimiz size yardımcı olmak için burada. 🤝

Mutlu veri düzenlemeler dileriz, modelleriniz isabetli ve anlayışlı olsun! 🌟



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar