正义的彬彬侠个人主页

@u013172930

正义的彬彬侠

2023-01-03 13:45:10 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【Hugging Face】TGI（Text Generation Inference）：高性能大语言模型推理框架

Hugging Face TGI，全称 Text Generation Inference，是 Hugging Face 推出的高性能大语言模型推理框架，专为部署、服务和推理大语言模型（LLMs）而优化，支持多 GPU、推理加速、量化、并发访问、OpenAI API 接口等功能。主要用于将 Hugging Face 上的模型部署为可访问的 API 服务。它为以下目标而设计：高效、低延迟的

#语言模型 #自然语言处理 #深度学习

【RLHF】直接偏好优化（Direct Preference Optimization, DPO）：基于偏好数据优化语言模型

直接偏好优化（DPO）是一种高效、简单的 RLHF 替代方法，通过直接基于偏好数据优化语言模型，省去了奖励模型和强化学习步骤。DPO 将偏好对齐问题转化为分类任务，利用语言模型的隐式奖励函数，性能与 PPO 相当（如胜率 ~70%），但训练成本显著降低（单 GPU 数小时）。其简单性和稳定性使其适合快速开发和资源受限场景，但对偏好数据质量依赖较高，缺乏 PPO 的动态探索能力。DPO 的提出简化

SuperGLUE：比GLUE更难的NLP评测基准，评估大规模预训练语言模型

SuperGLUE（Super General Language Understanding Evaluation）是比GLUE更难的NLP评测基准，用于评估大规模预训练语言模型（如T5、GPT-3、PaLM）的自然语言理解能力。它是GLUE Benchmark（2018）的升级版，专为更先进的NLP模型设计，包含8个任务，涉及因果推理、阅读理解、文本蕴含、指代消解等高难度NLP任务。GPT-3、

#自然语言处理 #python

【RLHF】RLAIF（ Scaling Reinforcement Learning from Human Feedback with AI Feedback）：利用人工智能生成偏好标签来训练奖励模

RLAIF 是一种通过使用现成的（off-the-shelf）大语言模型生成偏好标签来训练奖励模型（Reward Model, RM），并利用该奖励模型进行强化学习，从而优化语言模型输出的方法。相比 RLHF 依赖人类标注的高质量偏好数据，RLAIF 利用 AI 模型（如 PaLM 2、ChatGPT 等）生成偏好标签，显著降低了数据收集的成本和时间。

【Milvus】搜索（Search）和重新排序（Rerank）的概述和应用

搜索（Search）和重新排序（Rerank）是 Milvus 向量数据库中用于执行高效向量相似性搜索和优化结果排名的核心功能。搜索用于查找与查询向量最相似的记录，而重新排序则通过额外的排名算法对搜索结果进行优化，以提高相关性或满足特定业务需求。Milvus 支持向量搜索、标量过滤、全文检索和混合搜索，并通过重新排序机制（如 RRFRanker 或自定义排序）进一步调整结果顺序。本文包

#milvus #搜索

【scikit-learn】sklearn.model_selection.GridSearchCV 类：网格搜索交叉验证超参数优化

GridSearchCV是sklearn.model_selection提供的超参数优化工具，用于遍历所有可能的超参数组合，通过交叉验证选择最佳超参数。GridSearchCV遍历所有超参数组合，通过交叉验证选择最佳参数，适用于分类和回归任务。如果参数空间较大，可使用RandomizedSearchCV进行随机搜索。如果数据类别不均衡，应结合StratifiedKFold进行分层交叉验证。

#sklearn #scikit-learn #机器学习 +1

One API：开源的LLM API管理与分发系统部署和使用

One API是一个开源的LLM API管理与分发系统，支持多种主流大模型（如GPT、Claude、Gemini等），通过统一OpenAI API格式简化多模型访问。主要功能包括API Key管理、负载均衡、额度监控和二次分发。支持Docker一键部署，提供多语言界面和丰富配置选项，适合个人开发者或企业集成AI服务。用户可通过标准化接口访问不同模型，并实现灵活的权限控制和额度管理。部署简单，支持S

One API：开源的LLM API管理与分发系统部署和使用

北京智源人工智能研究院发布的OL-CC数据集

OL-CC（OpenLabel-Chinese Corpus）是北京智源人工智能研究院（BAAI）推出的中文大模型关键基础设施，其设计覆盖从预训练到指令微调的全流程需求。根据官方公开信息，OL-CC包含两大核心组成部分，分别服务于不同技术目标：OL-CC 1.0：大规模预训练语料库，OL-CC 2.0：对话指令微调数据集。该数据集的开放标志着中文大模型发展进入新阶段，其分层设计既满足基座模型的广泛

【LangGraph】MCP Adapters（模型上下文协议适配器）：连接多个 MCP 服务器并加载 LangChain 兼容工具、提示和资源的类和函数

LangChain 的 MCP 适配器模块提供了连接多个 MCP 服务器并加载工具、提示和资源的客户端，支持与 LangChain 生态系统的无缝集成。关键类：MultiServerMCPClient：客户端类，用于管理多个 MCP 服务器连接并加载资源。关键函数：load_mcp_tools：加载 MCP 工具并转换为 LangChain 工具。load_mcp_prompt：加载 MCP 提示

共 641 条

请选择