Ultralytics HUB-SDK ile Veri Kümesi Yönetimi
Ultralytics HUB-SDK Veri Kümesi Yönetimi belgelerine hoş geldiniz! 👋
Verimli veri kümesi yönetimi, makine öğreniminde çok önemlidir. İster deneyimli bir veri bilimcisi olun, ister yeni başlayan biri, veri kümesi işlemlerini nasıl yöneteceğinizi bilmek iş akışınızı kolaylaştırabilir. Bu sayfa, Ultralytics HUB-SDK'yı python'da kullanarak veri kümelerinde işlem gerçekleştirmenin temellerini kapsar. Sağlanan örnekler, veri kümelerini nasıl alacağınızı, oluşturacağınızı, güncelleyeceğinizi, sileceğinizi ve listeleyeceğinizi ve ayrıca veri kümesi erişimi için bir URL'yi nasıl alacağınızı ve veri kümelerini nasıl yükleyeceğinizi gösterir.
Hadi dalalım! 🚀
Kimliğe Göre Veri Kümesi Al
Benzersiz kimliğini kullanarak belirli bir veri kümesini hızla getirmek için aşağıdaki kod parçasını kullanın. Bu, verileri de dahil olmak üzere temel bilgilere erişmenizi sağlar.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Fetch a dataset by ID
dataset = client.dataset("<Dataset ID>") # Replace with your actual Dataset ID
print(dataset.data) # This prints the dataset information
Daha fazla detay için Datasets
sınıfı ve yöntemleri için bkz. Şunun için referans hub_sdk/modules/datasets.py
.
Bir Veri Kümesi Oluşturun
Yeni bir veri kümesi oluşturmak için, veri kümeniz için uygun bir ad tanımlayın ve şunu kullanın: create_dataset
metodu aşağıda gösterildiği gibi:
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Define your dataset properties
data = {"meta": {"name": "My Dataset"}} # Replace 'My Dataset' with your desired dataset name
# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")
Şuna bakın: create_dataset
daha fazla bilgi için API referansındaki metodu inceleyin.
Veri Kümesini Güncelleme
Projeler geliştikçe, veri kümenizin meta verilerini değiştirmeniz gerekebilir. Bu, yeni ayrıntılarla aşağıdaki kodu çalıştırmak kadar basittir:
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Obtain the dataset
dataset = client.dataset("<Dataset ID>") # Insert the correct Dataset ID
# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}}) # Modify 'Updated Name' as required
print("Dataset updated with new information.")
update
metodu, veri kümelerini güncelleme hakkında daha fazla ayrıntı sağlar.
Veri Kümesini Sil
Çalışma alanınızı düzenlemek veya artık ihtiyaç duyulmadığı için bir veri kümesini kaldırmak için şunu çağırarak kalıcı olarak silebilirsiniz: delete
yöntem:
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Select the dataset by its ID
dataset = client.dataset("<Dataset ID>") # Ensure the Dataset ID is specified
# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")
Sabit silmeler de dahil olmak üzere silme seçenekleri hakkında daha fazla bilgi için delete
metot dokümantasyonu.
Veri Kümelerini Listeleme
Veri kümelerinize göz atmak için, tüm veri kümelerinizi sayfalama ile listeleyin. Bu, çok sayıda veri kümesiyle uğraşırken faydalıdır.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Retrieve the first page of datasets
datasets = client.dataset_list(page_size=10)
print("Current dataset:", datasets.results) # Show the datasets on the current page
# Move to the next page and show results
datasets.next()
print("Next page result:", datasets.results)
# Go back to the previous page
datasets.previous()
print("Previous page result:", datasets.results)
DatasetList
sınıfı, veri kümelerini listeleme ve sayfalandırma hakkında daha fazla ayrıntı sağlar.
Depolamadan URL Al
Bu işlev, veri kümesi depolama erişimi için bir URL getirerek, uzaktan depolanan veri kümesi dosyalarını veya yapıtlarını indirmeyi kolaylaştırır.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Define the dataset ID for which you want a download link
dataset = client.dataset("<Dataset ID>") # Replace Dataset ID with the actual dataset ID
# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)
get_download_link
metot dokümantasyonu ek ayrıntılar sağlar.
Veri Kümesi Yükleme
Veri kümenizi yüklemek basittir. Veri kümenizin kimliğini ve dosya yolunu ayarlayın, ardından şunu kullanın: upload_dataset
işlevi:
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Select the dataset
dataset = client.dataset("<Dataset ID>") # Substitute with the real dataset ID
# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>") # Specify the correct file path
print("Dataset has been uploaded.")
upload_dataset
metodu, veri kümelerini yükleme hakkında daha fazla ayrıntı sağlar. Ayrıca ilgili hakkında da bilgi edinebilirsiniz DatasetUpload
sınıfı.
Her şeyin sorunsuz çalıştığından emin olmak için Veri Kümesi Kimliklerinizi ve dosya yollarınızı iki kez kontrol etmeyi unutmayın.
Herhangi bir sorunla karşılaşırsanız veya sorularınız olursa, destek ekibimiz size yardımcı olmak için burada. 🤝
Mutlu veri düzenlemeler dileriz, modelleriniz isabetli ve anlayışlı olsun! 🌟