logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CPU上跑Vicuna大模型:llama.cpp量化推理实操指南

大语言模型推理不再依赖GPU显卡,CPU也能高效运行——核心在于模型量化与硬件特性协同优化。通过llama.cpp框架,结合Q4_K_M等分组量化技术,可将7B级Vicuna模型压缩至3.2GB以内,在支持AVX2的i5/Ryzen 5等主流CPU上实现14+ tokens/s的流式响应。其原理是利用CPU高命中率L3缓存、双通道内存带宽及mmap按需加载机制,规避显存瓶颈与swap抖动。该方案广

#Vicuna
DeepSeek R1本地部署实战:Ollama+GGUF量化全链路指南

大语言模型本地化部署是当前AI工程落地的核心能力,涉及模型加载、显存优化、格式转换与推理服务集成等关键技术环节。其中,GGUF格式作为Ollama生态的标准输入,具备内存映射、架构感知和量化灵活等优势,已成为轻量级本地推理的事实标准。而DeepSeek R1作为基于Qwen2.5蒸馏的高性能7B中文模型,其原生PyTorch权重需经架构对齐的GGUF转换才能稳定运行——这要求开发者理解qwen2架

#Ollama
SgLang代码细读-3.Cache

1.SgLang代码细读-3.Cache2.SgLang代码细读-2.forward过程3.SgLang代码细读-1.从req到batch收起。

java解析csv文件写入mysql_使用 opencsv 读写 csv 文件(结合 mysql)

前言最近遇到了项目需求,需要从 mysql 中导出数据为 csv 文件,再从 csv 文件中读取数据保存到 mysql。经过检索分析,决定使用 opencsv 实现需求。本需求可以分为四部分:mysql 数据转换为 java 对象。java 对象转换为 csv 文件。csv 文件转换为 java 对象。java 对象映射保存到 mysql 中。其中1, 4两步是我们熟悉的增删改查,不必多说。需要解

保姆级教程:在昇腾300I NPU上,用Docker一步搞定BGE-M3 Embedding模型部署

本文详细介绍了在昇腾300I NPU上使用Docker部署BGE-M3 Embedding模型的完整流程,包括环境准备、镜像获取、Docker启动参数详解、性能调优及异常排查等关键步骤。通过实战经验分享,帮助开发者高效解决NPU环境下的部署难题,提升AI模型部署效率。

#昇腾
mysql自动化运维平台_MySQL自动化运维审核平台archery

archery是一套SQL审核平台,支持SQL审核、SQL优化(SQLAdvisor|SOAR|SQLTuning)、脱敏查询、慢日志管理、数据库审核、表结构同步、会话管理、RDS管理首先安装docker( 可以参考我的文章centos7安装docker)操作系统为centos71 安装docker-compose首先安装依赖yum install python-develpip inst...

eclipse项目部署服务器,在 eclipse 中将 web 项目部署到 tomcat 服务器上

1、在 eclipse 中,选择 Window--->Preferences--->Server--->Runtime Environments,选择 Add 按钮2、在弹出的对话框中,选择 Tomcat 服务器的版本,然后点击 Next3、在弹出来的对话框中,选择 tomcat 的本地路径,JRE的版本等,点击 Finish,最后点击OK4、创建 Servers,如果找不到 S

java怎么插入oracle数据库timenstamp_Oracle插入timestamp类型数据

create table TEST(IDINTEGER,BIRTHDAY TIMESTAMP);使用JDBC将日期插入到TIMESTAMP类型字段import java.sql.Connection;import java.sql.DriverManager;import java.sql.PreparedStatement;import java.sql.SQLException;...

matlab图像目标与背景分离_第4章 图像分割与特征提取及MATLAB实现.ppt

第4章 图像分割与特征提取及MATLAB实现.ppt第4章图像分割与特征提取及MATLAB实现图像分割:是指将图像中有意义的对象与其背景分离,并把这些对象按照不同的含义分割开来,也就是说,把图像中具有不同含义的对象提取出来。 图像分割的方法:大致可以分为基于边缘检测的方法和基于区域生成的方法两大类。 边缘检测技术:是所有基于边界分割的图像分析方法的第一步,首先检测出图像局部特性的不连续性,...

labelme maskrcnn 批量_Matterport版Mask RCNN——训练自己的数据集——踩坑小记

Matterport版Mask RCNN——训练自己的数据集——踩坑小记前言一、基本配置系统配置Matterport环境配置Conda 虚拟环境Pycharm的安装和使用上述环境二、制作自己的数据集实现默认程序测试结果制作labelme数据集安装labelme改进的json_to_dataset.py准备好的数据目录结构三、自定义数据集训练增加头文件include确认yaml读取函数代码修改内容总

    共 12 条
  • 1
  • 2
  • 请选择