weixin_44929001 个人主页

@weixin_44929001

weixin_44929001

2022-11-17 15:40:39 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

EverMemOS 访问外部(deepinfra)API接口

EverMemOS通过调用外部大模型API实现内部业务功能，主要提供三个接口：/v1/chat/completions用于大语言模型对话，支持流式输出和参数调节；/v1/embeddings用于文本向量化，支持不同编码格式和维度设置；/v1/reranker用于文档重排序。每个接口都有明确的请求参数和响应格式规范，例如聊天接口包含消息列表、温度值等参数，返回包含角色对话内容和token使用情况。这

#java #服务器 #前端

Docker中部署Ollama大模型服务的完整指南

本文详细介绍了在Docker中部署Ollama大模型服务的完整流程。从基础部署（镜像拉取、容器启动）到核心操作（模型管理、容器维护），再到高级配置（GPU加速、环境变量），提供了详细命令和参数说明。同时包含常见问题排查指南，如端口冲突、下载慢等解决方案。通过Docker的容器化部署方式，可快速搭建Ollama服务并实现数据持久化，支持GPU加速提升性能。适合开发者快速上手部署大模型服务环境。

#docker #eureka #容器

Celery调用AI服务

定义了一个名为 LoadModelTask 的Celery任务，用于加载GPU模型并将模型参数保存在任务上下文中。我们还在启动Celery worker时注册了任务上下文。在使用GPU模型的任务 use_model 中，我们从任务上下文中读取模型参数，并在计算过程中使用该模型。使用这种方法，可以确保GPU模型只被加载一次，并且可以轻松地在任务之间共享模型参数和其他全局变量。

#人工智能 #深度学习 #python

到底了