logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

开放基础设施赋能 AI:OpenStack 在下一代云中的角色

vLLM 作为高性能推理运行时,将原始 GPU 容量转换为优化的服务层。创新解决的问题效果静态 KV cache 分配导致内存碎片化和 GPU 利用率差引入 KV cache 的虚拟内存抽象传统静态批处理导致 GPU 利用率不足动态合并新请求到已运行的执行图OpenStack 已经从传统的云计算平台演变为支撑 AI 工作负载的全功能开放基础设施。

#人工智能#openstack
开放基础设施赋能 AI:OpenStack 在下一代云中的角色

vLLM 作为高性能推理运行时,将原始 GPU 容量转换为优化的服务层。创新解决的问题效果静态 KV cache 分配导致内存碎片化和 GPU 利用率差引入 KV cache 的虚拟内存抽象传统静态批处理导致 GPU 利用率不足动态合并新请求到已运行的执行图OpenStack 已经从传统的云计算平台演变为支撑 AI 工作负载的全功能开放基础设施。

#人工智能#openstack
ModuleNotFoundError: No module named ‘langchain.chains‘问题解决

摘要:学生在实验环境中遇到"ModuleNotFoundError: No module named 'langchain.chains'"错误,起初依赖AI助手未能解决。最终通过查阅官方文档发现,新版本langchain_classic的正确导入方式应为from langchain_classic.chains import LLMChain等。经验教训:遇到问题应优先查阅官

Open Moltbot 多Agent配置与协调工作详细教程

新东西太多了,又要学习Moltbot 了。

#人工智能
OpenClaw 操控浏览器

当你让 OpenClaw 执行浏览器操作时,必须指定 profile,否则默认走 openclaw 或 chrome 模式。在 OpenClaw 的 Agent / Skill / 对话中使用这个 profile。点击、输入、上传文件、滚动、截图、执行 JS 等等,全都能做。在 OpenClaw 里添加 remote profile。先确保 Chrome 已正确启动(调试端口开启)基本上配置好 r

#python
Open Moltbot 多Agent配置与协调工作详细教程

新东西太多了,又要学习Moltbot 了。

#人工智能
为培训课程准备的Ollama安装脚本

为培训课程准备的Ollama安装脚本说明:创建一个完整的Ollama安装脚本,基于官方文档并集成到现有的用户环境中。$(EOF。

#python
DeepSeek+本地知识库配置

BAAI/BGE-M3 是由北京智源研究院(BAAI)和中国科学技术大学联合开发的开源语义向量模型,专注于多语言、多粒度和多功能检索任务。该模型支持超过100种语言,最大输入长度达8192词符,能够处理句子、段落、篇章及文档等不同粒度的文本。稠密检索:通过特殊标记[CLS]生成单个向量进行语义匹配;稀疏检索:基于词项权重实现类似BM25的关键词检索;多向量检索:利用细粒度交互提升相关性判断精度。

文章图片
#人工智能
安装多版本python-pytorch-Langchain开发环境

这是我上课的教案,给学生搭建自己的开发环境。共享到这里吧。

文章图片
#python#pytorch
本地部署DeepSeek-R1-Distill-Qwen-7B

点击主界面左下方的“设置”,弹出“设置”窗口,在“模型”选项卡中选择模型类型,因为安装模型的提供方选择“OLLAMA API”,Chatbox能检测到通过OLLAMA 运行起来的模型,选择对话的模型,比如装的是“deepseek-1:1.5b”,点击“保存”按钮保存设置。(3)通过Ollama官网下载DeepSeek-R1模型,首先到Ollama官网确认一下需要下载的DeepSeek模型类型,ht

#人工智能
    共 15 条
  • 1
  • 2
  • 请选择