logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

源2.0-M32大模型发布4bit/8bit量化版! 运行显存仅需23GB,性能可媲美LLaMA3

近日,浪潮信息发布源2.0-M32大模型4bit和8bit量化版,性能比肩700亿参数的LLaMA3开源大模型。4bit量化版推理运行显存仅需23.27GB,处理每token所需算力约为1.9 GFLOPs,算力消耗仅为同等当量大模型LLaMA3-70B的1/80。

文章图片
#人工智能#语言模型#pytorch +2
Yuan2.0大模型,联合向量数据库和Llama-index,助力检索增强生成技术

利用Yuan大模型、向量数据库和LlamaIndex助力大模型检索增强生成技术,为NLP领域开辟了一个可能性领域。这个管道不仅可以理解和生成文本,而且还利用庞大的信息数据库来增强其响应,使其在聊天机器人、推荐系统等各种应用程序中具有难以置信的强大功能。然而,旅程并没有就此结束。NLP的世界正在迅速发展,保持最新趋势和技术的更新至关重要。这里讨论的实现是进入更广泛、更复杂的语言理解和生成世界的垫脚石

文章图片
#数据库
【转载】快速上手!LLaMa-Factory最新微调实践,轻松实现专属大模型

文章转载自浪潮圈Yuan2.0()是浪潮信息发布的新一代基础语言大模型,该模型拥有优异的数学、代码能力。自发布以来,Yuan2.0已经受到了业界广泛的关注。当前Yuan2.0已经开源参数量分别是102B、51B和2B的3个基础模型,以供研发人员做进一步的开发。LLM(大语言模型)微调方案是解决通用大模型落地私有领域的一大利器。基于开源大模型的微调,不仅可以提升LLM对于指令的遵循能力,也能通过行业

文章图片
源大模型的快速部署与高效推理——GGUF格式模型介绍与使用教程

源2.0 是浪潮信息发布的新一代基础语言大模型。我们开源了全部的3个模型源2.0-102B,源2.0-51B和源2.0-2B。并且我们提供了预训练,微调,推理服务的相关脚本,以供研发人员做进一步的开发。源2.0是在源1.0的基础上,利用更多样的高质量预训练数据和指令微调数据集,令模型在语义、数学、推理、代码、知识等不同方面具备更强的理解能力。更多详情请参考Yuan2.0模型技术报告和Github。

文章图片
#人工智能#语言模型#深度学习 +1
NeuIPS 2024 | CoT推理的新突破:推理边界框架(RBF)

本研究提出了推理边界框架(Reasoning Boundary Framework, RBF),该框架提出了一种全新的方法来量化LLMs的推理能力,并提供优化路径。

文章图片
#人工智能#语言模型
大模型 MCP:让 AI 从 “键盘侠” 变 “行动派” 的魔法协议

最近大模型领域的MCP(model context protocol)炒得沸沸扬扬,有好多小伙伴来找我,想让通俗的讲讲什么是MCP,这东西与之前的function call技术,以及agent有什么区别。这个比较可以看出,MCP和Agent有本质的区别,MCP更像是 “工具箱”,提供螺丝刀、扳手,而Agent 是 “工程师”,用工具箱组装机器人。MCP 会帮模型记笔记。可以看出,如果比作开车的话,

文章图片
#人工智能
【转载】快速上手!LLaMa-Factory最新微调实践,轻松实现专属大模型

文章转载自浪潮圈Yuan2.0()是浪潮信息发布的新一代基础语言大模型,该模型拥有优异的数学、代码能力。自发布以来,Yuan2.0已经受到了业界广泛的关注。当前Yuan2.0已经开源参数量分别是102B、51B和2B的3个基础模型,以供研发人员做进一步的开发。LLM(大语言模型)微调方案是解决通用大模型落地私有领域的一大利器。基于开源大模型的微调,不仅可以提升LLM对于指令的遵循能力,也能通过行业

文章图片
浪潮信息“源”Embedding模型登顶MTEB榜单第一名

近期,浪潮信息开源了Yuan系列Embedding模型(Yuan-Embedding-1.0),该模型在中文语义向量评测基准——C-MTEB(Chinese Massive Text Embedding Benchmark)的Retrieval任务中荣获第一名,为用户加速基于大模型的智能应用创新提供了有力支持。

文章图片
#人工智能#语言模型#开源
Yuan2.0大模型,联合向量数据库和Llama-index,助力检索增强生成技术

利用Yuan大模型、向量数据库和LlamaIndex助力大模型检索增强生成技术,为NLP领域开辟了一个可能性领域。这个管道不仅可以理解和生成文本,而且还利用庞大的信息数据库来增强其响应,使其在聊天机器人、推荐系统等各种应用程序中具有难以置信的强大功能。然而,旅程并没有就此结束。NLP的世界正在迅速发展,保持最新趋势和技术的更新至关重要。这里讨论的实现是进入更广泛、更复杂的语言理解和生成世界的垫脚石

文章图片
#数据库
源大模型的快速部署与高效推理——GGUF格式模型介绍与使用教程

源2.0 是浪潮信息发布的新一代基础语言大模型。我们开源了全部的3个模型源2.0-102B,源2.0-51B和源2.0-2B。并且我们提供了预训练,微调,推理服务的相关脚本,以供研发人员做进一步的开发。源2.0是在源1.0的基础上,利用更多样的高质量预训练数据和指令微调数据集,令模型在语义、数学、推理、代码、知识等不同方面具备更强的理解能力。更多详情请参考Yuan2.0模型技术报告和Github。

文章图片
#人工智能#语言模型#深度学习 +1
    共 16 条
  • 1
  • 2
  • 请选择