
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。转载自 | 新智元大语言模型(LLM)通常过于庞大,无法在消费级硬件上运行。这些模型的参数可能超过数十亿,通常需要显存较大的GPU来加速推理过程。因此,越来越多的研究开始关注如何缩小模型,比如改进

相信一直关注AI领域的同学都听说过这个工具-LangChain,这是一个融合了语言模型与多样化工具、数据及应用程序的新兴技术框架。LangChain的核心价值在于它多维度地重塑了人工智能与人类社会的互动界面,通过将大型语言模型与广泛资源的无缝对接,同时,LangChain整合知识图谱、数据库等多元信息源,为复杂决策过程提供了详实而深入的数据支撑。

• SFT、RLHF 和 DPO 都是先估计 LLMs 本身的偏好,再与人类的偏好进行对齐;• SFT 只通过 LLMs 生成的下一个单词进行估计,而 RLHF 和 DPO 通过 LLMs 生成的完整句子进行估计,显然后者的估计会更准确;• 虽然 RLHF 和 DPO 取得比 SFT 好的结果,但代价是高昂的数据构造和计算资源开销;

7月30日,由前瞻产业研究院携手华为云、首钢基金、深圳上市公司协会联合发起,深圳市政府指导的“深圳产业会客厅——2024人工智能产业对接活动”圆满举办。会上,前瞻产业研究院院长徐文强以“中国AI发展的必然与挑战”为题,深度剖析了《2024年前瞻中国AI大模型场景应用趋势蓝皮书》(以下简称为《蓝皮书》)。徐院指出,随着全球AI技术的飞速发展,中国正站在AI产业变革的关键节点上,面临着前所未有的发展机

在人工智能和机器学习主导的大模型时代背景下,设计模式的知识对于软件开发从业者来说变得尤为重要。这些模式作为构建灵活、可扩展系统的基石,在新兴技术快速发展的环境下,帮助开发者应对挑战。以下书单涵盖了设计模式的经典原则及其在现代技术中的应用,旨在为软件工程师、系统架构师等专业人员提供与时俱进的参考,帮助他们适应技术革新的浪潮。小编推荐这个关于设计模式的书单,希望可以帮助从业者更好地理解其在现代技术环境

今天分享一篇技术文章,你可能听说过很多大模型的知识,但却从未亲自使用或微调过大模型。大模型微调本身是一件非常复杂且技术难度很高的任务,因此本篇文章仅从零开始,手把手带你走一遍微调大模型的过程,并不会涉及过多技术细节。希望通过本文,你可以了解微调大模型的流程。微调大模型需要非常高的电脑配置,比如GPU环境,相当于你在已经预训练好的基础上再对大模型进行一次小的训练。但是不用担心,本篇文章会使用阿里魔塔

RAG即检索增强生成,为 LLM 提供了从某些数据源检索到的信息,并基于此修正生成的答案。RAG 基本上是 Search + LLM 提示,可以通过大模型回答查询,并将搜索算法所找到的信息作为大模型的上下文。查询和检索到的上下文都会被注入到发送到 LLM 的提示语中。嵌入式搜索引擎可以通过 Faiss 来实现,向量搜索领域成为了RAG的一个助力。像pinecone 这样的向量数据库可以构建开源搜索

今天分享一篇技术文章,你可能听说过很多大模型的知识,但却从未亲自使用或微调过大模型。大模型微调本身是一件非常复杂且技术难度很高的任务,因此本篇文章仅从零开始,手把手带你走一遍微调大模型的过程,并不会涉及过多技术细节。希望通过本文,你可以了解微调大模型的流程。微调大模型需要非常高的电脑配置,比如GPU环境,相当于你在已经预训练好的基础上再对大模型进行一次小的训练。但是不用担心,本篇文章会使用阿里魔塔

RAG即检索增强生成,为 LLM 提供了从某些数据源检索到的信息,并基于此修正生成的答案。RAG 基本上是 Search + LLM 提示,可以通过大模型回答查询,并将搜索算法所找到的信息作为大模型的上下文。查询和检索到的上下文都会被注入到发送到 LLM 的提示语中。嵌入式搜索引擎可以通过 Faiss 来实现,向量搜索领域成为了RAG的一个助力。像pinecone 这样的向量数据库可以构建开源搜索

社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。转载自 | 新智元大语言模型(LLM)通常过于庞大,无法在消费级硬件上运行。这些模型的参数可能超过数十亿,通常需要显存较大的GPU来加速推理过程。因此,越来越多的研究开始关注如何缩小模型,比如改进








