CrawlForge
首页应用场景集成价格文档博客
  1. 首页
  2. /
  3. 术语表
  4. /
  5. 微调

微调

AI / MCP

定义

微调是在特定数据集上对预训练语言模型进行进一步训练,以使其行为针对特定任务或领域专门化的过程。它将通用模型适配到有针对性的使用场景。

与 CrawlForge 的关联

微调需要大量高质量的领域专属文本数据集。从网络上采集这些数据是大规模网页抓取最常见的用途之一。训练数据的质量直接影响微调后模型的表现。

CrawlForge 的 batch_scrape 和 extract_content 正是为这一工作流而设计。使用 batch_scrape 并行处理数百个 URL,使用 extract_content 获取适合训练的干净结构化文本。这一流水线能够从文档站点、论坛、学术论文或任何网络来源构建数据集。

相关 CrawlForge 工具

batch_scrape
5 credits
extract_content
2 credits
extract_text
1 credits

相关术语

大语言模型 (LLM)

大语言模型是一种在海量文本数据上训练的神经网络,能够理解并生成人类语言。LLM 为 AI 助手、代码生成器和自主智能体提供动力。

Token

token 是语言模型处理的基本文本单位。文本在被模型处理前会被切分为 token(每个 token 大约 4 个字符或 0.75 个单词)。token 数量决定了成本和上下文限制。

嵌入向量

嵌入向量是文本、图像或其他数据的稠密数值向量表示。它们以一种支持相似度搜索、聚类及其他机器学习操作的格式捕捉语义含义。

AI 智能体

AI 智能体是由大语言模型驱动的自主系统,能够对任务进行推理、做出决策,并通过使用工具来采取行动。智能体超越了简单的聊天机器人,能够规划并执行多步骤工作流。

立即领取 1,000 个免费 credits 开始抓取

立即开始使用 CrawlForge,无需信用卡。

领取 1,000 个免费 credits 开始抓取

页脚

CrawlForge

面向 AI Agent 的企业级网页抓取。23 个专业 MCP 工具,专为构建智能系统的现代开发者而设计。

产品

  • 功能
  • 价格
  • 应用场景
  • 集成
  • 替代方案
  • 更新日志

资源

  • 快速上手
  • API 参考
  • 模板
  • 指南
  • 博客
  • 术语表
  • 常见问题
  • 网站地图

开发者

  • MCP 协议
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

公司

  • 关于我们
  • 联系我们
  • 隐私政策
  • 服务条款

保持更新

获取新工具和新功能的最新动态。

基于 Next.js 和 MCP 协议构建

© 2025-2026 CrawlForge。保留所有权利。