源大模型个人主页

@2401_82700030

源大模型

2024-02-02 08:03:16 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

源2.0-M32大模型发布4bit/8bit量化版! 运行显存仅需23GB，性能可媲美LLaMA3

近日，浪潮信息发布源2.0-M32大模型4bit和8bit量化版，性能比肩700亿参数的LLaMA3开源大模型。4bit量化版推理运行显存仅需23.27GB，处理每token所需算力约为1.9 GFLOPs，算力消耗仅为同等当量大模型LLaMA3-70B的1/80。

#人工智能 #语言模型 #pytorch +2

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

利用Yuan大模型、向量数据库和LlamaIndex助力大模型检索增强生成技术，为NLP领域开辟了一个可能性领域。这个管道不仅可以理解和生成文本，而且还利用庞大的信息数据库来增强其响应，使其在聊天机器人、推荐系统等各种应用程序中具有难以置信的强大功能。然而，旅程并没有就此结束。NLP的世界正在迅速发展，保持最新趋势和技术的更新至关重要。这里讨论的实现是进入更广泛、更复杂的语言理解和生成世界的垫脚石

#数据库

【转载】快速上手！LLaMa-Factory最新微调实践，轻松实现专属大模型

文章转载自浪潮圈Yuan2.0（）是浪潮信息发布的新一代基础语言大模型，该模型拥有优异的数学、代码能力。自发布以来，Yuan2.0已经受到了业界广泛的关注。当前Yuan2.0已经开源参数量分别是102B、51B和2B的3个基础模型，以供研发人员做进一步的开发。LLM（大语言模型）微调方案是解决通用大模型落地私有领域的一大利器。基于开源大模型的微调，不仅可以提升LLM对于指令的遵循能力，也能通过行业

源大模型的快速部署与高效推理——GGUF格式模型介绍与使用教程

源2.0 是浪潮信息发布的新一代基础语言大模型。我们开源了全部的3个模型源2.0-102B，源2.0-51B和源2.0-2B。并且我们提供了预训练，微调，推理服务的相关脚本，以供研发人员做进一步的开发。源2.0是在源1.0的基础上，利用更多样的高质量预训练数据和指令微调数据集，令模型在语义、数学、推理、代码、知识等不同方面具备更强的理解能力。更多详情请参考Yuan2.0模型技术报告和Github。

#人工智能 #语言模型 #深度学习 +1

NeuIPS 2024 | CoT推理的新突破：推理边界框架（RBF）

本研究提出了推理边界框架（Reasoning Boundary Framework, RBF），该框架提出了一种全新的方法来量化LLMs的推理能力，并提供优化路径。

#人工智能 #语言模型

【转载】快速上手！LLaMa-Factory最新微调实践，轻松实现专属大模型

浪潮信息“源”Embedding模型登顶MTEB榜单第一名

近期，浪潮信息开源了Yuan系列Embedding模型（Yuan-Embedding-1.0），该模型在中文语义向量评测基准——C-MTEB（Chinese Massive Text Embedding Benchmark）的Retrieval任务中荣获第一名，为用户加速基于大模型的智能应用创新提供了有力支持。

#人工智能 #语言模型 #开源

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

#数据库

源大模型的快速部署与高效推理——GGUF格式模型介绍与使用教程

#人工智能 #语言模型 #深度学习 +1

【转载】快速上手！LLaMa-Factory最新微调实践，轻松实现专属大模型

共 14 条

请选择