CrawlForge
首页应用场景集成价格文档博客
  1. 首页
  2. /
  3. 应用案例
  4. /
  5. 内容迁移

内容迁移

从旧版网站提取并重构内容,迁移至现代化平台。

面临的问题

从旧版 CMS 平台迁移内容意味着要在保留结构、元数据和格式的同时提取数千个页面。手动复制粘贴既容易出错又极其缓慢。

解决方案

CrawlForge 的 crawl_deep 会沿着内部链接遍历整个网站,extract_text 则从每个页面提取干净的内容。一次自动化运行即可迁移数百个页面。

代码示例

// Crawl legacy site and extract all content for migration
const crawl = await mcp.crawl_deep({
  url: "https://legacy-site.com/blog",
  max_depth: 3,
  follow_links: true,
  include_patterns: ["/blog/*"],
});

// Extract clean text from each discovered page
const pages = await Promise.all(
  crawl.urls.map(url =>
    mcp.extract_text({ url, preserve_structure: true })
  )
);

console.log(`Migrated ${pages.length} pages`);

使用的工具

crawl_deep5 credits
extract_text1 credits

预估费用:每个页面约 6 credits

准备好开始了吗?

每个新账户均可获得 1,000 个免费 credits,无需信用卡。

免费领取 1,000 个 credits 开始使用

相关应用案例

SEO 分析与审计
审计你的网站及竞争对手的元数据、失效链接、内容缺口与排名机会。
extract_metadata (2 cr)map_site (3 cr)analyze_content (3 cr)
AI 训练数据采集
采集并结构化大规模网页数据集,用于微调和训练 AI 模型。
batch_scrape (5 cr)extract_content (2 cr)

页脚

CrawlForge

面向 AI Agent 的企业级网页抓取。23 个专业 MCP 工具,专为构建智能系统的现代开发者而设计。

产品

  • 功能
  • 价格
  • 应用场景
  • 集成
  • 替代方案
  • 更新日志

资源

  • 快速上手
  • API 参考
  • 模板
  • 指南
  • 博客
  • 术语表
  • 常见问题
  • 网站地图

开发者

  • MCP 协议
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

公司

  • 关于我们
  • 联系我们
  • 隐私政策
  • 服务条款

保持更新

获取新工具和新功能的最新动态。

基于 Next.js 和 MCP 协议构建

© 2025-2026 CrawlForge。保留所有权利。