logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM大语言模型评测方法全面总结!

本文回顾了自然语言处理中的评测基准与指标,将大语言模型评估分为经典和新型评测范式,分析了现有评测的不足。接着介绍了全面的大语言模型评测思想、相关指标和方法,并总结了当前广受关注的大语言模型评测新方向。需要说明的是,本文所指的大语言模型并非严格限定规模,而是指以预训练为基础、具有通用能力的语言模型。

文章图片
#人工智能#自然语言处理
适合初学者人手一本的LLM大语言模型综述,爆火全网!(附完整版PDF)

今天给大家推荐一本大模型(LLM)这块的一本外文书,经过整理已经出中文版了,就是这本《大型语言模型综述》!本书在git上有9.2k star,还是很不错的一本大模型方面的书。

文章图片
#语言模型#人工智能
怎么让英文大语言模型支持中文?(二)继续预训练

前面我们已经讲过怎么构建中文领域的tokenization,接下来我们将介绍继续预训练。

#人工智能#自然语言处理#AI
MaxKB基于大语言模型和 RAG 的知识库问答系统

MaxKB 是一款基于大语言模型和 RAG(检索增强生成)的开源知识库问答系统,专为智能客服、企业知识库管理、学术研究和教育等多场景设计。

文章图片
#人工智能#自然语言处理#RAG +1
WorkflowLLM:增强大语言模型的工作流编排能力

该框架的优势在于,它不仅能够自动化处理复杂的工作流,还能在没有显式示例的情况下对新任务进行推理和编排。

文章图片
#人工智能#自然语言处理#语言模型 +1
2024年6月上半月30篇大语言模型的论文推荐

大语言模型(LLMs)在近年来取得了快速发展。本文总结了2024年6月上半月发布的一些最重要的LLM论文,可以让你及时了解最新进展。

文章图片
#人工智能
DeepSeek模型在113家央国企的部署及应用,大模型入门到精通,收藏这篇就足够了!

DeepSeek模型在央企和地方国企的部署广泛且深入,应用场景丰富,为企业的智能化转型提供了强大助力。

#人工智能#产品经理
大模型炼丹术(三):从单头到多头,深度解析大语言模型中的注意力机制

在之前的两节内容中,我们已经将输入的句子通过tokenizer映射到了一个个的token IDs,并进一步做了连续编码,得到了包含充分语义信息的embedding向量。现在,让我们继续探索接下来的数据流向。GPT模型的架构是一个类似Transformer解码器架构的网络,因此本文将从Transformer的核心组件“注意力机制”开始讲起。

#语言模型#人工智能#自然语言处理
史上最强大语言模型的知识库-MaxKB部署实践

大家好,不知道大家还记得大名鼎鼎的jumpserver吗?市面上开源为数不多的堡垒机产品,由飞致云开发的,本次我要隆重介绍这款知识库大模型产品(MaxKB)也是飞致云开发的社区开源产品,可以免费建立50个知识库和5个应用(专业版除外),还支持API接口以及第三方嵌入调用。

文章图片
#人工智能#自然语言处理#AI
    共 1035 条
  • 1
  • 2
  • 3
  • 104
  • 请选择