xnuscd 个人主页

@xnuscd

xnuscd

2024-11-22 09:14:03 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

后端开发入门

有时，内置的异常类不足以满足需求，可以定义自定义异常并创建相应的处理器。步骤：定义自定义异常类注册异常处理器在路径操作中抛出自定义异常原子性（Atomicity）：事务中的所有操作要么全部完成，要么全部不执行。一致性（Consistency）：事务执行前后，数据库都处于一致的状态。隔离性（Isolation）：事务的执行不受其他事务的干扰。持久性（Durability）：事务一旦提交，结果是永久性

#oracle #数据库 #网络

DeepSeek学习

奖励函数部分：代码中实现了三个奖励函数，用来衡量生成回答的正确性和格式是否满足要求。这部分代码调用了 Python 内置的re模块和标准数据结构操作。强化学习框架：虽然文件中没有展示完整的 RL 训练循环，但奖励函数的设计正是为 RL 训练服务的。你可以将这些奖励函数嵌入到如 PPO 这类 RL 算法的训练循环中。常用的库包括 Hugging Face 的 Transformers（生成回答）和

#学习 #windows

pycharm和git

本地分支：在你自己电脑上独立开发用的分支，不会自动同步到服务器。远程分支：服务器上的分支，是团队共享的代码状态，可以通过git pull和git push与本地保持同步。冲突产生的原因：多个人在同一个文件的同一处地方同时做了不同的修改，Git 无法自动合并。解决冲突的方法：手动编辑有冲突的文件，选择合适的修改内容，然后提交解决后的版本。通过熟悉以上步骤和概念，你就能更顺畅地应对团队协作中出现的版本

#ubuntu

PPO学习

基准模型：保持不变，作为原始语言能力的参考。训练模型：根据 PPO 算法被更新，目标是生成高质量且符合奖励标准的文本。奖励模型：为生成的文本提供即时反馈（打分），指导训练模型的更新。状态价值模型：评估当前状态的未来奖励，帮助计算优势，进而指导更稳定、更有效的策略更新。通过这四个模型的协同工作，PPO 能够在微调过程中实现既不偏离预训练知识，又能适应特定任务要求的目标，从而提高大模型的实用性和安全性

只要理解了。

是一个用于 FastAPI 的 JWT 身份验证库。它简化了 JWT 的生成、验证和管理过程，提供了一套易于使用的 API 来处理访问令牌（Access Token）和刷新令牌（Refresh Token）。您可以根据需求自定义验证逻辑和异常处理。

#fastapi #网络 #linux

FAISS创建知识库2

要在该代码中使用不同的嵌入模型（例如m3e-base或bge-large），我们可以使代码更具通用性，将嵌入模型作为参数传递，以便能够动态加载任何支持的嵌入模型。此外，我们可以利用或库的预训练模型来生产嵌入。

#faiss

FAISS知识库创建

在方法中，定义了文档的最低相似度要求或最高允许距离。

#faiss

qwen vllm function_call

vLLM 是一个高效、易于使用的大型语言模型推理和部署库。自vLLM v0.6.0版本起，它支持工具调用（Tools Calling），允许模型在适当情况下自动解析和调用工具。本文将通过使用Qwen2.5模型的示例，介绍如何利用vLLM实现工具调用，并使用OpenAI兼容API与客户端交互。本教程涵盖了使用vLLM API实现Qwen模型的工具调用功能。通过OpenAI兼容API和Hermes风格

#java

qwen vllm function_call

#java

共 20 条

请选择