青苔猿猿个人主页

@yilvqingtai

青苔猿猿

2022-09-16 17:38:13 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Android——模块级build.gradle配置——applicationId和namespace

配置应用模块-applicationId和namespace。了解 build.gradle 中的实用设置。

#android

CentOS-8中“Failed to download metadata for repo ‘AppStream‘: Cannot download repomd.xml”

Failed to download metadata for repo ‘AppStream‘: Cannot download repomd.xml: Cannot download repodaFailed to download metadata for repo ‘AppStream‘: Cannot download repomd.xml: Cannot download repoda

#nginx #linux

（四）docker命令—镜像管理命令

docker import 命令是一种从容器快照创建新镜像的灵活方法，适用于迁移、恢复和自定义。

#docker

（Nacos）—nacos server集群+docker compose+节点IP问题+多数据库

nacos server集群+docker compose+节点IP问题+多数据库

#docker

OpenWebUI(1)图像集成——deepseek+comfyUI文生图搭建

openwebui+deepseek+comfyUI搭建文生图效果

#ComfyUI #工作流

Ollama（4）模型生命周期

keep_alive 在工程化的项目中，往往需要根据请求的频率来设置，如果请求不频繁，可以使用默认值或较短的时间，以便在不使用时释放内存。而如果应用程序需要频繁调用模型，可以设置较长的keep_alive 时间，以减少加载时间。很关键，非常影响服务器的性能和应用程序的用户体验。大家一定要注意。

OpenWebUI(7)源码学习-后端utils/images/comfyui.py文生图模块

摘要：comfyui.py是Open WebUI项目中连接ComfyUI图像生成系统的核心模块，通过WebSocket实现实时交互。它提供标准化的参数输入接口（支持提示词、尺寸、批量生成等），动态注入工作流节点参数，并返回生成图像的URL列表。模块采用异步架构，内置完善的错误处理，支持自定义workflow扩展。典型应用包括文本转图像、批量生成等场景，为前端提供统一的AI图像生成服务接口。

vLLM（1）私有化安装部署配置

vLLM是目前主流的大模型部署框架之一，以其高效的内存管理、持续批处理和张量并行性在企业生产环境中表现突出。该框架通过PagedAttention算法优化KV缓存管理，支持GPU加速和连续批处理，并内置API安全验证功能，同时兼容HuggingFace模型和OpenAI接口。安装过程需创建Python 3.12虚拟环境后直接pip安装即可。后续将重点介绍其多模态应用场景。

#人工智能

OpenWebUI(2)源码学习-后端retrieval检索模块

本文介绍了AI对话系统中的一个检索模块目录结构及其功能。该模块主要包含数据加载器（如PDF/URL加载）、检索模型（如ColBERT）、向量数据库操作（支持Chroma/Elasticsearch等）和网络搜索（集成Bing/Brave等引擎）四个核心组件，为AI系统提供外部知识检索能力。通过统一的接口设计，模块实现了多源数据加载、语义向量检索和搜索结果重排序等功能，有效提升对话系统的知识获取效率

Ollama（3）模型迁移和API使用

摘要：本文介绍了Ollama模型迁移方法和REST API使用指南。第一部分详细说明模型迁移步骤，重点解析了blobs和manifests文件夹的作用及迁移方法，包括在线下载和离线传输两种方式。第二部分重点讲解Ollama的REST API接口，特别是/api/generate接口的参数配置和使用方法，详细解释了num_ctx、num_predict等关键参数的含义及对模型性能的影响，并提供了Py

共 34 条

请选择