返回搜索GitHub

RAG / 知识库 / AI 编程 / MCP / 开发者工具

crawl4ai

开源 LLM 友好型网页爬虫和 Scraper

质量分83
65,417 Stars
2026-05-06T08:37:05Z
unknown
easy

中文速读

Crawl4AI 是专为 LLM 应用设计的开源网页爬虫,能将网页内容转换为 LLM 友好的格式。支持 Python 包和 Docker 部署,有完善的 API 文档和博客。适合 AI 应用数据采集和 RAG 知识库构建。

适合

  • 为 LLM 应用采集数据的开发者
  • 构建 RAG 知识库的团队

不适合

  • 只需要通用爬虫的用户
  • 大规模企业爬取场景

标签

爬虫LLM数据采集RAG