Migración de contenido
Extrae y reestructura contenido de sitios heredados para migrarlo a plataformas modernas.
El problema
Migrar contenido desde plataformas CMS heredadas implica extraer miles de páginas conservando la estructura, los metadatos y el formato. El copiar y pegar manual es propenso a errores y dolorosamente lento.
La solución
crawl_deep de CrawlForge recorre sitios completos siguiendo los enlaces internos, mientras que extract_text obtiene contenido limpio de cada página. Migra cientos de páginas en una sola ejecución automatizada.
Ejemplo de código
// Crawl legacy site and extract all content for migration
const crawl = await mcp.crawl_deep({
url: "https://legacy-site.com/blog",
max_depth: 3,
follow_links: true,
include_patterns: ["/blog/*"],
});
// Extract clean text from each discovered page
const pages = await Promise.all(
crawl.urls.map(url =>
mcp.extract_text({ url, preserve_structure: true })
)
);
console.log(`Migrated ${pages.length} pages`);Herramientas utilizadas
crawl_deep5 credits
extract_text1 credit
Costo estimado: ~6 credits por página
¿Listo para comenzar?
Cada cuenta nueva recibe 1,000 credits gratis. No se requiere tarjeta de crédito.
Comienza gratis con 1,000 creditsCasos de uso relacionados
Análisis y auditoría SEO
Audita tu sitio y el de la competencia en busca de metadatos, enlaces rotos, brechas de contenido y oportunidades de posicionamiento.
extract_metadata (2 cr)map_site (3 cr)analyze_content (3 cr)
Recopilación de datos de entrenamiento para IA
Recopila y estructura conjuntos de datos web a gran escala para el ajuste fino y el entrenamiento de modelos de IA.
batch_scrape (5 cr)extract_content (2 cr)