开源大预言模型中的GGUF和GGML格式分别是什么意思

soragui

2650人浏览 · 2024-02-04 08:57:11

soragui · 2024-02-04 08:57:11 发布

GGUF 和 GGML 是用于存储推断模型的文件格式，特别是在语言模型如 GPT（生成式预训练变换器）的背景下。让我们探讨一下它们之间的关键区别，以及各自的优缺点。

GGML（GPT-Generated Model Language）: 由 Georgi Gerganov 开发，GGML 是一个为机器学习设计的张量库，便于在各种硬件上实现大型模型和高性能，包括 Apple Silicon。

优点:

早期创新: GGML 是早期尝试创建 GPT 模型文件格式的一种尝试。
单一文件共享: 它使在单个文件中共享模型成为可能，提高了便利性。
CPU 兼容性: GGML 模型可以在 CPU 上运行，扩大了可访问性。

缺点:

灵活性受限: GGML 难以添加有关模型的额外信息。
兼容性问题: 引入新功能通常会导致与旧模型的兼容性问题。
需要手动调整: 用户经常需要修改设置，如 rope-freq-base、rope-freq-scale、gqa 和 rms-norm-eps，这可能会很复杂。

GGUF（GPT-Generated Unified Format），作为 GGML 的继任者，于 2023 年 8 月 21 日发布。这个格式代表了语言模型文件格式领域的一大进步，便于存储和处理像 GPT 这样的大型语言模型。

由来自人工智能社区的贡献者开发，包括 GGML 的创作者 Georgi Gerganov，GGUF 的创建符合大规模 AI 模型的需求，尽管它似乎是一项独立的努力。它在涉及 Facebook（Meta）的 LLaMA（大型语言模型 Meta AI）模型的情境中的使用凸显了它在 AI 领域的重要性。有关 GGUF 的更多详细信息，您可以参考 GitHub 的问题这里并探索 Georgi Gerganov 的 llama.cpp 项目这里。

优点:

解决 GGML 的限制: GGUF 设计旨在克服 GGML 的缺点，提升用户体验。
可扩展性: 它允许添加新功能，同时与旧模型保持兼容性。
稳定性: GGUF 专注于消除破坏性变化，简化迁移到新版本的过程。
多功能性: 支持各种模型，超越了 llama 模型的范围。

缺点:

过渡时间: 将现有模型转换为 GGUF 可能需要相当长的时间。
需要适应: 用户和开发者必须适应这种新格式。

总结:

GGUF 是对 GGML 的升级，提供了更大的灵活性、可扩展性和兼容性。它旨在简化用户体验并支持超越 llama.cpp 范围的更多模型。虽然 GGML 是一个有价值的初步尝试，但 GGUF 解决了它的局限性，标志着语言模型文件格式开发的进步。这一过渡有望通过提高模型共享和使用效率来造福 AI 社区。

AtomGit 开源协作平台测评赛

瓜分20万奖金获得内推名额丰厚实物奖励易参与易上手

更多推荐

ADS1292R 使用过程心电图高精度ADC模块

文章目录1 Fundamentals ofPrecision ADC Noise Analysis 精密模数转换器噪声分析基础1 Fundamentals ofPrecision ADC Noise Analysis 精密模数转换器噪声分析基础https://www.ti.com.cn/cn/lit/wp/slyy192/slyy192.pdf?ts=1600659610730&ref_u

开放原子开发者工作坊

实现一个家庭安防与环境监测系统（一）

开放原子开发者工作坊

【cf】Codeforces Round #774 (Div. 2) 前4题

题目A. Square Counting 简单数学题目大意题解代码B. Quality vs Quantity 排序题目大意题解代码C. Factorials and Powers of Two 状态压缩dp+位运算题目大意题解代码D. Weight the Tree 树形dp+dfs题目大意题解代码E. Power Board 看起来像是数论？许多年没打cf了，偶尔打了一盘，恢复紫名了。A. S