تخطي إلى المحتوى

إدارة مجموعة البيانات باستخدام Ultralytics HUB-SDK

مرحبًا بك في وثائق إدارة مجموعات البيانات الخاصة بـ Ultralytics HUB-SDK! 👋

تعد إدارة مجموعة البيانات بكفاءة أمرًا بالغ الأهمية في تعلم الآلة. سواء كنت عالم بيانات متمرسًا أو مبتدئًا، فإن معرفة كيفية التعامل مع عمليات مجموعة البيانات يمكن أن يبسط سير عملك. تغطي هذه الصفحة أساسيات إجراء العمليات على مجموعات البيانات باستخدام Ultralytics HUB-SDK في Python. توضح الأمثلة المقدمة كيفية الحصول على مجموعات البيانات وإنشائها وتحديثها وحذفها وإدراجها، وكذلك كيفية الحصول على عنوان URL للوصول إلى مجموعة البيانات وتحميل مجموعات البيانات.

هيا بنا ننطلق! 🚀

الحصول على مجموعة بيانات بواسطة المعرف

لجلب مجموعة بيانات معينة بسرعة باستخدام المعرف الفريد الخاص بها، استخدم مقتطف التعليمات البرمجية أدناه. يتيح لك ذلك الوصول إلى المعلومات الأساسية، بما في ذلك بياناتها.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Fetch a dataset by ID
dataset = client.dataset("<Dataset ID>")  # Replace with your actual Dataset ID
print(dataset.data)  # This prints the dataset information

لمزيد من التفاصيل حول Datasets class والطرق الخاصة به، راجع مرجع لـ hub_sdk/modules/datasets.py.

إنشاء مجموعة بيانات

لإنشاء مجموعة بيانات جديدة، حدد اسمًا مألوفًا لمجموعة البيانات الخاصة بك واستخدم create_dataset الطريقة كما هو موضح أدناه:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define your dataset properties
data = {"meta": {"name": "My Dataset"}}  # Replace 'My Dataset' with your desired dataset name

# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")

انظر إلى create_dataset الأسلوب في مرجع API لمزيد من المعلومات.

تحديث مجموعة بيانات

مع تطور المشاريع، قد تحتاج إلى تعديل بيانات التعريف الخاصة بمجموعة البيانات الخاصة بك. هذا بسيط مثل تشغيل الكود التالي بالتفاصيل الجديدة:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Obtain the dataset
dataset = client.dataset("<Dataset ID>")  # Insert the correct Dataset ID

# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}})  # Modify 'Updated Name' as required
print("Dataset updated with new information.")

في update يوفر الأسلوب مزيدًا من التفاصيل حول تحديث مجموعات البيانات.

حذف مجموعة بيانات

لإزالة مجموعة بيانات، سواء كان ذلك لترتيب مساحة العمل الخاصة بك أو لأنها لم تعد ضرورية، يمكنك حذفها نهائيًا عن طريق استدعاء delete الطريقة:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset by its ID
dataset = client.dataset("<Dataset ID>")  # Ensure the Dataset ID is specified

# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")

لمزيد من المعلومات حول خيارات الحذف، بما في ذلك عمليات الحذف التام، راجع delete وثائق الأسلوب.

قائمة مجموعات البيانات

لتصفح مجموعات البيانات الخاصة بك، قم بسرد جميع مجموعات البيانات الخاصة بك مع ترقيم الصفحات. هذا مفيد عند التعامل مع عدد كبير من مجموعات البيانات.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Retrieve the first page of datasets
datasets = client.dataset_list(page_size=10)
print("Current dataset:", datasets.results)  # Show the datasets on the current page

# Move to the next page and show results
datasets.next()
print("Next page result:", datasets.results)

# Go back to the previous page
datasets.previous()
print("Previous page result:", datasets.results)

في DatasetList class يوفر مزيدًا من التفاصيل حول سرد وتصفح مجموعات البيانات.

الحصول على عنوان URL من وحدة التخزين

تجلب هذه الدالة عنوان URL للوصول إلى تخزين مجموعة البيانات، مما يسهل تنزيل ملفات مجموعة البيانات أو القطع الأثرية المخزنة عن بُعد.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define the dataset ID for which you want a download link
dataset = client.dataset("<Dataset ID>")  # Replace Dataset ID with the actual dataset ID

# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)

في get_download_link توفر وثائق الأسلوب تفاصيل إضافية.

تحميل مجموعة البيانات

يعد تحميل مجموعة البيانات الخاصة بك أمرًا مباشرًا. قم بتعيين معرف مجموعة البيانات الخاصة بك ومسار الملف، ثم استخدم upload_dataset :

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset
dataset = client.dataset("<Dataset ID>")  # Substitute with the real dataset ID

# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>")  # Specify the correct file path
print("Dataset has been uploaded.")

في upload_dataset يوفر الأسلوب مزيدًا من التفاصيل حول تحميل مجموعات البيانات. يمكنك أيضًا التعرف على DatasetUpload class.

تذكر التحقق مرة أخرى من معرفات مجموعة البيانات ومسارات الملفات للتأكد من أن كل شيء يعمل بسلاسة.

إذا واجهتك أي مشكلات أو كانت لديك أسئلة، فإن فريق الدعم لدينا هنا للمساعدة. 🤝

نتمنى لكم تذليلًا سعيدًا للبيانات، ونتمنى أن تكون نماذجكم دقيقة وبصيرة! 🌟



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات