Conjuntos de Dados do Ultralytics HUB
Os conjuntos de dados do Ultralytics HUB são uma solução prática para gerenciar e aproveitar seus conjuntos de dados personalizados.
Uma vez carregados, os conjuntos de dados podem ser utilizados imediatamente para o treinamento do modelo. Essa abordagem integrada facilita uma transição perfeita do gerenciamento do conjunto de dados para o treinamento do modelo, simplificando significativamente todo o processo.
Assista: Fazer Upload de Conjuntos de Dados para o Ultralytics HUB | Guia Completo do Recurso de Upload de Conjunto de Dados
Fazer Upload do Conjunto de Dados
Os conjuntos de dados do Ultralytics HUB são como os conjuntos de dados YOLOv5 e YOLOv8 🚀. Eles usam a mesma estrutura e os mesmos formatos de rótulo para manter tudo simples.
Antes de enviar um conjunto de dados para o Ultralytics HUB, certifique-se de colocar seu arquivo YAML do conjunto de dados dentro do diretório raiz do conjunto de dados e que seu YAML do conjunto de dados, diretório e ZIP tenham o mesmo nome, como mostrado no exemplo abaixo e, em seguida, compacte o diretório do conjunto de dados.
Por exemplo, se o seu conjunto de dados for chamado "coco8", como o nosso COCO8 conjunto de dados de exemplo, então você deve ter um coco8.yaml
dentro do seu coco8/
diretório, o que criará um coco8.zip
quando compactado:
zip -r coco8.zip coco8
Você pode baixar nosso conjunto de dados de exemplo COCO8 e descompactá-lo para ver exatamente como estruturar seu conjunto de dados.
O YAML do conjunto de dados é o mesmo formato YAML padrão YOLOv5 e YOLOv8.
coco8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip
Após compactar seu conjunto de dados, você deve validá-lo antes de enviá-lo para o Ultralytics HUB. O Ultralytics HUB realiza a verificação de validação do conjunto de dados após o envio, portanto, ao garantir que seu conjunto de dados esteja formatado corretamente e livre de erros com antecedência, você pode evitar quaisquer contratempos devido à rejeição do conjunto de dados.
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
Depois que seu ZIP do conjunto de dados estiver pronto, navegue até a página Conjuntos de Dados clicando no botão Conjuntos de Dados na barra lateral e clique no botão Carregar Conjunto de Dados no canto superior direito da página.
Esta ação irá acionar a caixa de diálogo Carregar Conjunto de Dados.
Selecione a tarefa do conjunto de dados e carregue-o no campo Arquivo .zip do conjunto de dados.
Você tem a opção adicional de definir um nome e uma descrição personalizados para seu conjunto de dados do Ultralytics HUB.
Quando estiver satisfeito com a configuração do seu conjunto de dados, clique em Upload.
Depois que seu conjunto de dados for carregado e processado, você poderá acessá-lo na página Conjuntos de dados.
Você pode visualizar as imagens em seu conjunto de dados agrupadas por divisões (Treino, Validação, Teste).
Dica
Cada imagem pode ser ampliada para melhor visualização.
Além disso, você pode analisar seu conjunto de dados clicando na aba Visão geral.
Em seguida, treine um modelo no seu conjunto de dados.
Baixar Dataset
Navegue até a página Dataset do dataset que você deseja baixar, abra o menu suspenso de ações do dataset e clique na opção Download. Esta ação iniciará o download do seu dataset.
Compartilhar Conjunto de Dados
Informação
A funcionalidade de compartilhamento do Ultralytics HUB oferece uma maneira conveniente de compartilhar conjuntos de dados com outras pessoas. Este recurso foi projetado para acomodar tanto os usuários existentes do Ultralytics HUB quanto aqueles que ainda não criaram uma conta.
Nota
Você tem controle sobre o acesso geral aos seus conjuntos de dados.
Você pode escolher definir o acesso geral como "Privado", caso em que, apenas você terá acesso a ele. Alternativamente, você pode definir o acesso geral como "Não Listado", o que concede acesso de visualização a qualquer pessoa que tenha o link direto para o conjunto de dados, independentemente de ter ou não uma conta Ultralytics HUB.
Navegue até a página Dataset do dataset que você deseja compartilhar, abra o menu suspenso de ações do dataset e clique na opção Compartilhar. Esta ação irá acionar a caixa de diálogo Compartilhar Dataset.
Defina o acesso geral como "Não listado" e clique em Salvar.
Agora, qualquer pessoa que tenha o link direto para seu conjunto de dados pode visualizá-lo.
Dica
Você pode clicar facilmente no link do conjunto de dados exibido na caixa de diálogo Compartilhar Conjunto de Dados para copiá-lo.
Editar Conjunto de Dados
Navegue até a página Dataset do dataset que você deseja editar, abra o menu suspenso de ações do dataset e clique na opção Editar. Esta ação irá acionar a caixa de diálogo Atualizar Dataset.
Aplique as modificações desejadas ao seu conjunto de dados e, em seguida, confirme as alterações clicando em Salvar.
Excluir Conjunto de Dados
Navegue até a página Dataset do dataset que você deseja excluir, abra o menu suspenso de ações do dataset e clique na opção Excluir. Esta ação irá excluir o dataset.