MonkeyKing_sunyuhua 个人主页

@sunyuhua_keyboard

MonkeyKing_sunyuhua

2022-09-16 17:52:34 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

怎么验证cuda版本，并重新安装

此错误信息表明你当前使用的PyTorch版本并未编译以支持CUDA。这通常意味着你可能安装了CPU-only版本的PyTorch，或者你的PyTorch版本与CUDA版本不兼容。通过上述步骤，你应该能够解决“Torch not compiled with CUDA enabled”的问题，并使PyTorch能够利用GPU加速你的计算任务。，根据你的系统环境（操作系统、CUDA版本等）选择合适的安装

#python

ImportError: libGL.so.1: cannot open shared object file: No such file or directory

摘要： Docker容器部署过程中出现worker服务启动失败问题。日志显示worker在加载PDF分割表格检测模块时出错，提示Volcengine SDK未安装（已改用HTTP方式调用API）。问题可能出现在依赖安装或模块导入环节，需要检查PDF相关工具库的安装情况及模块间的依赖关系。同时服务配置显示当前为开发环境（CODE_ENV=dev），建议核查开发环境配置文件是否正确加载。

#python

jina-embeddings 的使用教程，怎么用它做embeddings和rerank的操作呢？

生成文本嵌入：通过模型，可以轻松地为任意文本生成高维向量嵌入。相似度计算：使用余弦相似度比较文本嵌入，进行相似性判断。重排序：根据嵌入向量和查询之间的相似度，对候选文本进行重排序，提高检索结果的相关性。GPU 支持：在加载模型时，可以选择使用 GPU 加速推理。通过这些步骤，你可以利用生成高效的文本嵌入，并基于这些嵌入来优化文本检索和重排序的效果。

#jina

启动监控页面监控vllm，大模型，显存的占用情况

摘要：本文介绍使用Prometheus+Grafana构建vLLM服务的全栈监控方案。通过DCGM Exporter采集GPU指标，cAdvisor收集容器/主机资源，配合vLLM原生指标，实现从模型请求、GPU显存到系统资源的统一监控。提供Docker Compose一键部署脚本，包含PromQL查询示例和告警规则配置，支持可视化运行状态、资源使用率和性能瓶颈分析。方案还支持通过OpenTele

VLLM Server启动的服务，怎么写一个python程序调用

这篇文章介绍了如何启动和调用vLLM服务器的详细步骤。主要内容包括：启动vLLM服务器的bash脚本配置，包括GPU设置、并行参数、内存利用率等关键参数。 Python调用vLLM服务器的完整代码实现，通过OpenAI兼容API提供多种功能：简单聊天功能带历史记录的聊天流式聊天响应文本补全功能交互式聊天界面代码展示了如何配置客户端、处理错误、实现流式输出以及管理聊天历史记录。文章提

#python #开发语言

ubuntu22.04安装DBeaver可视化数据库管理工具

要在 Ubuntu 22.04 上安装 DBeaver，您可以选择使用 Ubuntu 软件中心的图形界面方法或使用命令行方法通过官方 DBeaver 仓库或 Snap 包安装。

#数据库

安装向量数据库milvus可视化工具attu

用户名和密码可以不填写，直接链接。

#milvus

python项目，登录生成token,后面所有接口验证token,如果是fastapi搭建的项目应该怎么实现

在这个示例中，我们使用了 FastAPI 提供的 OAuth2PasswordBearer 来处理 Token 的验证。用户登录时会提供用户名和密码，服务器会验证密码的正确性，如果验证通过，则生成 Token 并返回给用户。用户在后续请求需要验证的接口时，需要在请求的 Header 中带上 Token，服务器会解析 Token 并验证其有效性。在使用 FastAPI 框架搭建的 Python 项目

#python #fastapi #java

Invalid value type for attribute ‘factoryBeanObjectType‘: java.lang.String

版本冲突，将spring的版本下降。

#java #开发语言

python实现Markdown转化PDF的方案

然后替换您当前的PDF生成逻辑即可，API非常相似，但质量和稳定性更好。

共 503 条

请选择