内容迁移
从旧版网站提取并重构内容,迁移至现代化平台。
面临的问题
从旧版 CMS 平台迁移内容意味着要在保留结构、元数据和格式的同时提取数千个页面。手动复制粘贴既容易出错又极其缓慢。
解决方案
CrawlForge 的 crawl_deep 会沿着内部链接遍历整个网站,extract_text 则从每个页面提取干净的内容。一次自动化运行即可迁移数百个页面。
代码示例
// Crawl legacy site and extract all content for migration
const crawl = await mcp.crawl_deep({
url: "https://legacy-site.com/blog",
max_depth: 3,
follow_links: true,
include_patterns: ["/blog/*"],
});
// Extract clean text from each discovered page
const pages = await Promise.all(
crawl.urls.map(url =>
mcp.extract_text({ url, preserve_structure: true })
)
);
console.log(`Migrated ${pages.length} pages`);使用的工具
crawl_deep5 credits
extract_text1 credits
预估费用:每个页面约 6 credits