logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Llama.cpp:高效跨平台的大模型推理引擎

Llama.cpp:高效跨平台的大模型推理引擎【免费下载链接】llama.cppPort of Facebook's LLaMA model in C/C++项目地址: https://gitcode.com/GitHub_...

【亲测免费】 AutoGPTQ:基于GPTQ算法的轻量级大模型量化工具

**AutoGPTQ** 是一个致力于简化大规模语言模型(LLMs)量化的开源工具包,它提供了用户友好的API接口,核心算法基于高效的GPTQ(Generalized Quantization of Embedding and Weight Matrices)。这个项目采用 **Python** 作为主要编程语言,并依赖于PyTorch框架来实现其量化功能。通过重量级仅量化的方法,AutoGPTQ

AutoGPTQ:基于GPTQ算法的轻量级大模型量化工具

AutoGPTQ:基于GPTQ算法的轻量级大模型量化工具AutoGPTQAn easy-to-use LLMs quantization package with user-friendly apis, based on GPTQ algorithm....

Llama.cpp:高效跨平台的大模型推理引擎

Llama.cpp:高效跨平台的大模型推理引擎llama.cppPort of Facebook's LLaMA model in C/C++项目地址: https://gitcode.com/gh_mirrors/ll/l...

AutoGPTQ:基于GPTQ算法的轻量级大模型量化工具

AutoGPTQ:基于GPTQ算法的轻量级大模型量化工具AutoGPTQAn easy-to-use LLMs quantization package with user-friendly apis, based on GPTQ algorithm....

到底了