LangChain Extract自定义模型集成：添加本地LLM支持的完整指南

张涓曦Sea

392人浏览 · 2026-01-23 01:58:11

张涓曦Sea · 2026-01-23 01:58:11 发布

LangChain Extract自定义模型集成：添加本地LLM支持的完整指南

【免费下载链接】langchain-extract 🦜⛏️ Did you say you like data? 项目地址: https://gitcode.com/GitHub_Trending/la/langchain-extract

LangChain Extract是一个功能强大的数据提取工具，允许用户从各种文档中高效提取结构化信息。本指南将详细介绍如何为LangChain Extract添加本地LLM（大语言模型）支持，让你能够在不依赖外部API的情况下使用自定义模型进行数据提取。

为什么需要添加本地LLM支持

在数据处理和提取任务中，使用本地LLM具有诸多优势：

数据隐私保护：敏感数据无需发送到外部服务器
降低API成本：避免持续的API调用费用
提高响应速度：本地模型响应更快，无需网络延迟
离线使用能力：在没有网络连接的环境下依然可以工作

了解LangChain Extract的模型架构

LangChain Extract的模型管理主要通过backend/server/models.py文件实现。该文件定义了支持的模型列表、默认模型选择以及模型加载逻辑。

当前系统已支持多种云服务模型，包括OpenAI的GPT系列、Fireworks、Anthropic Claude等。这些模型通过环境变量进行配置，例如：

if "OPENAI_API_KEY" in os.environ:
    models["gpt-3.5-turbo"] = {
        "chat_model": ChatOpenAI(model="gpt-3.5-turbo", temperature=0),
        "description": "GPT-3.5 Turbo",
    }

添加本地LLM的准备工作

在开始集成本地模型前，请确保你已满足以下条件：

已安装LangChain Extract项目
本地LLM模型文件（如Llama、Mistral等）
必要的Python依赖库（如transformers、accelerate等）

如果你尚未安装项目，可以通过以下命令克隆并设置：

git clone https://gitcode.com/GitHub_Trending/la/langchain-extract
cd langchain-extract

集成本地LLM的步骤

步骤1：安装本地模型依赖

首先，需要安装支持本地模型运行的依赖库。打开终端，执行以下命令：

cd backend
poetry add transformers accelerate sentencepiece torch

步骤2：修改模型配置文件

打开backend/server/models.py文件，添加本地模型支持。我们需要添加一个新的模型配置到SUPPORTED_MODELS字典中。

在文件中找到get_supported_models()函数，添加以下代码：

# 添加本地模型支持
# 检查是否安装了transformers库
try:
    from langchain.llms import HuggingFacePipeline
    from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
    
    # 本地模型配置 - 以Llama 2为例
    models["local-llama2-7b"] = {
        "chat_model": HuggingFacePipeline.from_model_id(
            model_id="meta-llama/Llama-2-7b-chat-hf",
            task="text-generation",
            pipeline_kwargs={
                "max_new_tokens": 512,
                "temperature": 0,
                "top_p": 0.95,
                "do_sample": True,
            },
        ),
        "description": "本地Llama 2 7B模型",
    }
    
    # 添加更多本地模型...
except ImportError:
    # 如果没有安装transformers库，跳过本地模型注册
    pass

步骤3：配置模型分块大小

不同的模型有不同的上下文窗口大小，需要为新添加的本地模型配置适当的分块大小。在backend/server/models.py文件中找到CHUNK_SIZES字典，添加：

CHUNK_SIZES = {  # in tokens, defaults to int(4_096 * 0.8). Override here.
    "gpt-4-0125-preview": int(128_000 * 0.8),
    "local-llama2-7b": int(4096 * 0.8),  # Llama 2 7B的上下文窗口通常为4096 tokens
    # 添加其他本地模型的分块大小...
}

步骤4：设置环境变量（可选）

如果需要通过环境变量控制本地模型的启用，可以添加一个新的环境变量检查：

if os.environ.get("ENABLE_LOCAL_MODELS", "false").lower() == "true":
    # 本地模型配置代码...

然后在启动应用前设置环境变量：

export ENABLE_LOCAL_MODELS=true

步骤5：验证本地模型集成

完成上述修改后，启动应用并验证本地模型是否已成功添加：

cd backend
poetry run python server/main.py

在API请求中指定使用本地模型：

# 示例：使用本地模型进行提取
response = requests.post(
    "http://localhost:8000/api/extract",
    data={
        "text": "你的文档内容...",
        "extractor": '{"fields": [{"name": "title", "description": "文档标题"}]}',
        "model_name": "local-llama2-7b"
    }
)

优化本地模型性能

使用本地模型时，可以通过以下方法优化性能：

模型量化：使用4位或8位量化减少内存占用
模型缓存：缓存已加载的模型实例
批处理请求：合并多个提取请求以提高效率
硬件加速：如果有GPU，确保正确配置CUDA支持

故障排除

如果遇到本地模型无法加载或运行的问题，可以检查以下几点：

模型文件路径是否正确
依赖库版本是否兼容
系统内存是否足够
日志文件中是否有错误信息：backend/server/logs/app.log

总结

通过本指南，你已经学会了如何为LangChain Extract添加本地LLM支持。这一功能极大地扩展了项目的灵活性和应用场景，使你能够在保护数据隐私的同时利用强大的本地模型进行数据提取。

随着本地LLM技术的不断发展，你可以通过相同的方法集成新的模型，持续提升LangChain Extract的提取能力。如果你有自定义模型集成的经验，欢迎贡献代码到项目中，帮助更多用户受益于本地模型技术。

【免费下载链接】langchain-extract 🦜⛏️ Did you say you like data? 项目地址: https://gitcode.com/GitHub_Trending/la/langchain-extract

CSDN-OPC开发者社区

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容，并连接云服务、办公空间等稀缺资源，助你专注创造，无忧运营。

更多推荐

从零搭建 AI 智能体平台：AgentForge 完整架构解析与实战

CSDN-OPC开发者社区

Hermes - AI Agent 运行时框架详细介绍

摘要： Hermes是由Nous Research开源的个人AI Agent运行时框架，定位为"可自我进化的自主智能体"，主要功能是为编码Agent提供记忆管理、技能沉淀和后台自动化支持。其核心设计为三层结构化记忆体系（核心置顶记忆、会话检索记忆、技能化长期记忆），通过本地存储和检索实现跨会话上下文持久化，并能从执行经验中自动优化技能。需搭配大模型API（如Claude Code）使用，适合个人长

CSDN-OPC开发者社区

omniAgent：全本地部署的开源 AI Agent，让大模型真正帮你写代码

omniAgent：全本地部署的开源 AI Agent，让大模型真正帮你写代码 > 全知全能，本地运行，为系统性思考的开发者而生。 --- 最近一年，AI Agent 的概念从科幻走进现实。Cline、Claude Code、Cursor 等工具让我们看到了 AI 辅助编程的潜力，但它们要么是闭源 SaaS 服务，要么数据必须经过云端，要么无法深度定制。如果你和我一样，**既想要 Agent..