El Anahtar Noktaları Veri Kümesi
Giriş
El-anahtar noktaları veri seti, anahtar noktaları ile etiketlenmiş 26.768 el görüntüsü içerir ve bu da onu poz tahmini görevleri için Ultralytics YOLO gibi modelleri eğitmek için uygun hale getirir. Açıklamalar, yüksek doğruluk ve tutarlılık sağlayan Google MediaPipe kitaplığı kullanılarak oluşturulmuştur ve veri seti Ultralytics YOLO11 formatlarıyla uyumludur.
İzle: Ultralytics YOLO11 ile El Anahtar Noktaları Tahmini | İnsan El Pozu Tahmini Eğitimi
El İşaretleri
AnahtarNoktalar
Veri kümesi, el tespiti için anahtar noktaları içerir. Anahtar noktalar aşağıdaki gibi açıklanmıştır:
- Bilek
- Başparmak (4 nokta)
- İşaret parmağı (4 nokta)
- Orta parmak (4 nokta)
- Yüzük parmağı (4 nokta)
- Serçe parmağı (4 nokta)
Her el toplam 21 anahtar noktasına sahiptir.
Temel Özellikler
- Geniş Veri Kümesi: El kilit noktası açıklamaları içeren 26.768 görüntü.
- YOLO11 Uyumluluğu: YOLO11 modelleriyle kullanıma hazırdır.
- 21 Anahtar Nokta: Detaylı el pozu gösterimi.
Veri Seti Yapısı
El anahtar noktası veri seti iki alt kümeye ayrılmıştır:
- Train: Bu alt küme, el anahtar noktaları veri kümesinden alınmış ve poz tahmini modellerini eğitmek için etiketlenmiş 18.776 görsel içerir.
- Val: Bu alt küme, model eğitimi sırasında doğrulama amacıyla kullanılabilecek 7.992 resim içerir.
Uygulamalar
El anahtar noktaları, jest tanıma, AR/VR kontrolleri, robotik manipülasyon ve sağlık hizmetlerinde el hareketi analizi için kullanılabilir. Ayrıca hareket yakalama için animasyonda ve güvenlik için biyometrik kimlik doğrulama sistemlerinde de uygulanabilirler. Parmak pozisyonlarının ayrıntılı takibi, sanal nesnelerle hassas etkileşimi ve temassız kontrol arayüzlerini mümkün kılar.
Veri Seti YAML
Bir YAML (Yet Another Markup Language) dosyası, veri kümesi yapılandırmasını tanımlamak için kullanılır. Veri kümesinin yolları, sınıfları ve diğer ilgili bilgiler hakkında bilgi içerir. El Anahtar Noktaları veri kümesi söz konusu olduğunda, hand-keypoints.yaml
dosyası şu adreste tutulur: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/hand-keypoints.yaml.
ultralytics/cfg/datasets/hand-keypoints.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Hand Keypoints dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/hand-keypoints/
# Example usage: yolo train data=hand-keypoints.yaml
# parent
# ├── ultralytics
# └── datasets
# └── hand-keypoints ← downloads here (369 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: hand-keypoints # dataset root dir
train: images/train # train images (relative to 'path') 18776 images
val: images/val # val images (relative to 'path') 7992 images
# Keypoints
kpt_shape: [21, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx:
[0, 1, 2, 4, 3, 10, 11, 12, 13, 14, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20]
# Classes
names:
0: hand
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/hand-keypoints.zip
Kullanım
640 görüntü boyutuyla 100 epoch için Hand Keypoints veri kümesinde bir YOLO11n-pose modeli eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Mevcut argümanların kapsamlı bir listesi için model Eğitim sayfasına bakın.
Eğitim Örneği
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Örnek Görüntüler ve Açıklamalar
El anahtar noktaları veri seti, anahtar noktaları ile açıklanmış insan elleriyle çeşitli görüntüler içerir. İşte veri setinden bazı görüntü örnekleri ve bunlara karşılık gelen açıklamalar:
- Mozaiklenmiş Görüntü: Bu görüntü, mozaiklenmiş veri seti görüntülerinden oluşan bir eğitim grubunu göstermektedir. Mozaikleme, her eğitim grubundaki nesnelerin ve sahnelerin çeşitliliğini artırmak için birden çok görüntüyü tek bir görüntüde birleştiren eğitim sırasında kullanılan bir tekniktir. Bu, modelin farklı nesne boyutlarına, en boy oranlarına ve bağlamlara genelleme yeteneğini geliştirmeye yardımcı olur.
Örnek, Hand Keypoints veri setindeki görüntülerin çeşitliliğini ve karmaşıklığını ve eğitim sürecinde mozaiklemenin faydalarını sergilemektedir.
Alıntılar ve Teşekkürler
Araştırma veya geliştirme çalışmalarınızda el-anahtar noktaları veri kümesini kullanırsanız, lütfen aşağıdaki kaynakları belirtin:
Bu veri setinde kullanılan görselleri sağlayan aşağıdaki kaynaklara teşekkür etmek isteriz:
Görüntüler, her platform tarafından sağlanan ilgili lisanslar altında toplanmış ve kullanılmıştır ve Creative Commons Attribution-NonCommercial-ShareAlike 4.0 Uluslararası Lisansı altında dağıtılmaktadır.
Vizyon Yapay Zeka araştırmalarına yaptığı büyük katkılardan dolayı bu veri kümesinin yaratıcısı Rion Dsilva'yı da anmak isteriz.
SSS
El Anahtar Noktaları veri kümesi üzerinde bir YOLO11 modeli nasıl eğitirim?
Hand Keypoints veri kümesi üzerinde bir YOLO11 modeli eğitmek için Python'ı veya komut satırı arayüzünü (CLI) kullanabilirsiniz. İşte 640 görüntü boyutuyla 100 epok için bir YOLO11n-pose modeli eğitme örneği:
Örnek
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Mevcut argümanların kapsamlı bir listesi için model Eğitim sayfasına bakın.
El Anahtar Noktaları veri kümesinin temel özellikleri nelerdir?
El Anahtar Noktaları veri seti, gelişmiş poz tahmini görevleri için tasarlanmıştır ve çeşitli temel özellikler içerir:
- Geniş Veri Kümesi: El kilit noktası açıklamaları içeren 26.768 görüntü içerir.
- YOLO11 Uyumluluğu: YOLO11 modelleriyle kullanıma hazırdır.
- 21 Anahtar Nokta: Bilek ve parmak eklemleri dahil olmak üzere detaylı el pozu gösterimi.
Daha fazla ayrıntı için El Anahtar Noktaları Veri Kümesi bölümünü inceleyebilirsiniz.
El Anahtar Noktaları veri kümesini kullanmaktan hangi uygulamalar yararlanabilir?
El Anahtar Noktaları veri seti, aşağıdakiler dahil çeşitli alanlarda uygulanabilir:
- Hareket Tanıma: İnsan-bilgisayar etkileşimini geliştirme.
- AR/VR Kontrolleri: Artırılmış ve sanal gerçeklikte kullanıcı deneyimini iyileştirme.
- Robotik Manipülasyon: Robotik ellerin hassas kontrolünü sağlama.
- Sağlık Hizmetleri: Tıbbi teşhis için el hareketlerini analiz etme.
- Animasyon: Gerçekçi animasyonlar için hareket yakalama.
- Biyometrik Kimlik Doğrulama: Güvenlik sistemlerini geliştirme.
Daha fazla bilgi için Uygulamalar bölümüne bakın.
El Anahtar Noktaları veri kümesi nasıl yapılandırılmıştır?
El Anahtar Noktaları veri seti iki alt kümeye ayrılmıştır:
- Train: Poz tahmini modellerini eğitmek için 18.776 görsel içerir.
- Val: Model eğitimi sırasında doğrulama amacıyla 7.992 görüntü içerir.
Bu yapı, kapsamlı bir eğitim ve doğrulama süreci sağlar. Daha fazla ayrıntı için Veri Kümesi Yapısı bölümüne bakın.
Eğitim için veri kümesi YAML dosyasını nasıl kullanırım?
Veri kümesi yapılandırması, yollar, sınıflar ve diğer ilgili bilgileri içeren bir YAML dosyasında tanımlanır. Şuradaki hand-keypoints.yaml
dosyası şu adreste bulunabilir: hand-keypoints.yaml.
Bu YAML dosyasını eğitim için kullanmak üzere, yukarıdaki eğitim örneğinde gösterildiği gibi eğitim komut dosyanızda veya CLI komutunuzda belirtin. Daha fazla ayrıntı için Veri Kümesi YAML bölümüne bakın.