Skip to content
ai-supply.store
ОбзорКатегорииРейтингиСообществоAgent APIFAQ
ОпубликоватьВойти
catalog / DevOps & Infra / DVC
⬡PipelineDevOps & InfraFree

DVC

Git-like version control for ML datasets and pipelines — track experiments, reproduce results, and collaborate on data science projects.

@ai-supply
Установки67k
Рейтинг★ 4.6
Отзывы22
↗ Исходный репозиторий

DVC — Data Version Control

DVC brings Git-style version control to machine learning datasets, models, and pipelines. Define reproducible ML pipelines as code, cache large files in remote storage (S3, GCS, Azure, SSH), and track every experiment with lightweight metafiles committed to Git.

Key features

  • Data versioning — track large files and directories without bloating your Git repo
  • Pipeline DAGs — define stages with dvc.yaml; DVC caches and only re-runs changed stages
  • Experiment tracking — dvc exp run + dvc exp show for a clean experiment table
  • Remote storage — S3, GCS, Azure Blob, SSH, HDFS, and local remotes
  • CI/CD integration — dvc repro in GitHub Actions for reproducible ML pipelines
  • Python API — use programmatically in notebooks or scripts

Quick start

npx ai-supply add dvc-ml-pipeline-versioning

# Or install directly
pip install dvc

# Initialize in a Git repo
git init my-project && cd my-project
dvc init

# Track a dataset
dvc add data/train.csv
git add data/train.csv.dvc .gitignore
git commit -m "Track training data with DVC"

# Define a pipeline stage
dvc run -n train \
  -d data/train.csv -d src/train.py \
  -o model.pkl \
  python src/train.py

# Reproduce the pipeline
dvc repro

Curated mirror of the open-source DVC project (Apache-2.0). Install upstream from the repository.

More from @ai-supply

View profile →
◐Model
llama.cpp
Pure C/C++ LLM inference library — run quantized models on CPU, Metal, CUDA and more.
↓ 900k★ 4.9
⇄Connector
vLLM
High-throughput, memory-efficient LLM inference engine with PagedAttention and continuous batching.
↓ 820k★ 4.9
◉Agent
MetaGPT
Multi-agent framework that assigns GPT roles (PM, engineer, QA) to solve complex software tasks end-to-end.
↓ 820k★ 4.8
◆Skill
NLTK
The Natural Language Toolkit — Python's foundational NLP library for tokenization, POS tagging, parsing, and corpora.
↓ 760k★ 4.7
ai-supply.store

Маркетплейс возможностей ИИ. Навыки, MCP-серверы, плагины, агенты, датасеты — доступны людям, пригодны для потребления машинами.

api · v3.1status · all green
Контакты
support@ai-supply.storesecurity@ai-supply.store
Маркетплейс
  • Обзор
  • Категории
  • Рейтинги
  • Бенчмарки
Сообщество
  • Сообщество
  • FAQ
Для агентов
  • Быстрый старт (60s)
  • Авторизовать агента
  • Agent API
  • Спецификация OpenAPI
Для разработчиков
  • Опубликовать
  • Панель управления
  • Распределение дохода
Аккаунт
  • Войти
  • Настройки
Правовые документы
  • Условия использования
  • Соглашение издателя
  • Правила допустимого использования
  • Конфиденциальность