Skip to content
ai-supply.store
استكشافالفئاتلوحة المتصدرينالمجتمعAgent APIFAQ
تسجيل الدخولإنشاء حساب مجاني
catalog / Data & ETL / Crawl4AI
⇄ConnectorData & ETLFree

Crawl4AI

LLM-friendly open-source web crawler that turns pages into clean Markdown/JSON ready for RAG and agent pipelines.

@ai-supply
التثبيتات42k
↗ مستودع المصدر

Crawl4AI

Crawl4AI is an open-source, LLM-friendly web crawler and scraper that converts web pages into clean, structured Markdown or JSON ready to feed into RAG and agent pipelines. It is one of the most popular data-ingestion connectors for AI applications, designed for speed and for output that models can consume directly.

Key features

  • Fast async crawling built on Playwright with browser session reuse
  • LLM-ready Markdown generation with content filtering and pruning
  • CSS/XPath selectors plus LLM-based structured extraction strategies
  • Handles JavaScript-rendered pages, lazy loading, and stealth/anti-bot options
  • Python API and a Docker deployment for scale

Usage note: pip install crawl4ai, run the post-install browser setup, then use the async crawler to fetch a URL and receive cleaned Markdown plus extracted structured data.

Curated mirror of the open-source Crawl4AI (Apache-2.0). Get it from the source.

More from @ai-supply

View profile →
◇MCP server
GitHub MCP Server
Official GitHub MCP server — give your AI agent full read/write access to repos, issues, PRs, and actions.
↓ 771k
⠿Embedding
Sentence Transformers
State-of-the-art sentence and text embeddings — compute semantic similarity, clustering, and dense retrieval.
↓ 751k
◆Skill
NLTK
The Natural Language Toolkit — Python's foundational NLP library for tokenization, POS tagging, parsing, and corpora.
↓ 641k
◇MCP server
MCP TypeScript SDK
Official TypeScript/JavaScript SDK for building MCP servers and clients — the Node.js foundation for the Model Context Protocol.
↓ 629k
ai-supply.store

قدرات ذكاء اصطناعي مجانية ومفحوصة أمنيًا — مهارات وخوادم MCP وإضافات ووكلاء ومجموعات بيانات وغيرها، كلٌّ منها مُقيَّم ومُتابَع لحداثته، ومبنيّ للبشر والوكلاء على حدٍّ سواء.

api · v3.1status · all green
تواصل معنا
support@ai-supply.storesecurity@ai-supply.store
الكتالوج
  • استكشاف
  • الفئات
  • لوحة المتصدرين
  • المعايير
  • الأمان
المجتمع
  • المجتمع
  • FAQ
للوكلاء
  • بدء سريع (60s)
  • تفويض وكيل
  • Agent API
  • مواصفات OpenAPI
للمطورين
  • نشر
  • لوحة التحكم
الحساب
  • إنشاء حساب
  • تسجيل الدخول
  • الإعدادات
قانوني
  • الشروط
  • اتفاقية الناشر
  • سياسة الاستخدام المقبول
  • الخصوصية