
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
CacheBackedEmbeddings 是 LangChain 的嵌入包装器类,通过将文本的嵌入向量存储在缓存(支持多种后端,如内存、文件或数据库)中,复用已计算的结果,避免重复调用嵌入模型(如 OpenAIEmbeddings)。它特别适合处理大规模文档或重复文本,降低 API 调用成本和计算时间。初始化:配置 underlying_embeddings 和 document_embeddi
UnstructuredLoader 是 LangChain 的 langchain_unstructured 包中的文档加载器,基于 Unstructured 库(由 Unstructured.IO 提供)解析非结构化文档,支持多种文件类型,包括 PDF、Word、PowerPoint、HTML、Markdown、文本、图像等。它将文档分区为语义单元(如标题、叙述文本、表格),生成 LangCh
代码中使用了 langchain.chat_models.ChatOpenAI(即 ChatOpenAI 类),会触发 LangChainDeprecationWarning,提示该类在 LangChain 0.0.10 中已被废弃,并将在 1.0 中移除。官方推荐使用 langchain_openai.ChatOpenAI 替代。本回答将基于 LangChain 0.3.x,详细解释如何将 Ch
langchain_ollama.OllamaLLM 是一个便捷的 LLM 类,通过 Ollama 服务调用本地或远程模型(如 llama3)。核心功能包括:方法:invoke(同步)、stream(流式)、ainvoke/astream(异步)。参数:model(模型选择)、base_url(服务地址)、temperature(随机性)。使用方式:连接 Ollama 服务,生成文本,结合提示模板
langchain-huggingface 是 LangChain 生态系统的一个子库,专门用于将 Hugging Face 的模型和工具集成到 LangChain 框架中。LangChain 是一个用于构建基于语言模型的应用程序的框架,而 langchain-huggingface 提供了与 Hugging Face Hub 上的预训练模型、分词器和嵌入模型的无缝连接,支持文本生成、聊天、嵌入生

langchain_openai.ChatOpenAI 是 LangChain 中用于调用 OpenAI 对话模型(如 gpt-3.5-turbo、gpt-4)的类,基于 OpenAI 的聊天完成 API(Chat Completions API)。它继承自 BaseChatModel,支持结构化的消息输入(如 SystemMessage、HumanMessage),适合对话、问答和复杂任务。初始
langgraph.prebuilt 模块是 LangGraph 的核心模块,提供了 create_react_agent、ToolNode、tools_condition、ValidationNode、InjectedState 等预构建组件,简化了 ReAct 代理、工具执行和状态管理的开发。它通过封装常见逻辑,支持快速构建对话代理、自动化工作流和人类交互场景。模块设计注重易用性和灵活性,适合
langchain_chroma.Chroma 是 LangChain 提供的向量存储类,与 Chroma 数据库交互,用于存储嵌入向量并进行高效相似性搜索,广泛应用于检索增强生成(RAG)系统。常用方法包括:添加数据:add_documents, add_texts, from_documents, from_texts。检索:as_retriever, similarity_search, s
OL-CC(OpenLabel-Chinese Corpus)是北京智源人工智能研究院(BAAI)推出的中文大模型关键基础设施,其设计覆盖从预训练到指令微调的全流程需求。根据官方公开信息,OL-CC包含两大核心组成部分,分别服务于不同技术目标:OL-CC 1.0:大规模预训练语料库,OL-CC 2.0:对话指令微调数据集。该数据集的开放标志着中文大模型发展进入新阶段,其分层设计既满足基座模型的广泛
RLAIF 是一种通过使用现成的(off-the-shelf)大语言模型生成偏好标签来训练奖励模型(Reward Model, RM),并利用该奖励模型进行强化学习,从而优化语言模型输出的方法。相比 RLHF 依赖人类标注的高质量偏好数据,RLAIF 利用 AI 模型(如 PaLM 2、ChatGPT 等)生成偏好标签,显著降低了数据收集的成本和时间。







