logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

新手入门:大语言模型训练指南

本文是一份全面的新手指南,旨在指导初学者如何有效地培训大型语言模型(LLM)。文章首先介绍了Transformer架构的基础知识,这是现代LLMs的核心。接着,它深入探讨了预训练和微调的概念,强调了这些步骤在模型开发中的重要性。文章还详细讨论了低阶适应(LoRA)技术,这是一种新兴的高效训练方法,可以显著降低大型模型训练的计算和内存成本。此外,指南涵盖了关键的超参数调整,如批量大小、学习率和梯度累

文章图片
#语言模型#人工智能#自然语言处理
如何使用 ChatGPT 构建Chrome浏览器扩展

这里主要是提供一个思路,如何通过ChatGPT来开发一个属于我们自己的Chrome浏览器扩展,大家完全可以根据自己的需求自行开发,基本上也不需要具备什么技术背景,懂基础的电脑办公,具备ChatGPT的使用条件和环境即可。除了ChatGPT聊天工具外,其实前面介绍的很多AI编程工具也可以完成此项工作,比如GitHub Copilot结合Chat,Codeium的Chat模块,Bito AI的Chat

文章图片
#chrome#前端
Github Copilot VS Codeium ——哪款AI编程辅助工具更适合你

Codeium是一个建立在顶尖AI技术上的代码加速工具包,它提供了单行 + 多行代码生成、内置聊天和搜索等核心功能,同时支持70+的编程语言,支持17+主流IDEs,Codeium是一款功能强大的编程工具,能够帮助程序员更高效、更准确地编写代码。Codeium由的团队开发,该团队核心成员主要由华人组成,Exafunction通过优化深度学习推理工作负载,在资源利用率和成本改进方面可以提供10倍的性

文章图片
#github#copilot
Bito AI——智能编程辅助软件,提升10倍开发效率!(New)

其实对于Bito这款AI编程工具的介绍我早在4月26号就发布过了,为什么今天还会继续发布,主要考虑以下原因:1)、前面写这篇文章的时候,有一些问题跟官方沟通会在后续的版本发布,现在新版本发布了,今天会顺带在原来的基础上更新新版本提供的新功能和新特性。2)、可以免费白嫖GPT-4,其实Bito的聊天功能是基于OpenAI和ChatGPT的底层能力构建优化的,对于复杂的问题会自动路由到GPT-4模型来

文章图片
#人工智能#gpt-3#spring boot +1
Vanna AI:告别代码,用自然语言轻松查询数据库,领先的RAG2SQL技术让结果更智能、更精准!

Vanna,是一款革命性的AI SQL智能体,可以将复杂的SQL查询简化为日常语义对话。在生成式AI的助力下,Vanna 让数据库查询变得前所未有的简单和直观。它是基于 OpenAI 和 Google 提供的大语言模型(LLM)。Vanna 通过预训练模型,结合你的数据库进行微调,可以快速帮你量身打造一个定制化的AI助手。Vanna 是一个获得 MIT 许可的开源 Python RAG(检索增强生

文章图片
#人工智能
如何使用LoRA和PEFT微调 Mistral 7B 模型

对于大模型在一些安全级别较高的领域,比如在金融服务领域实施人工智能解决方案时,面临的最大挑战之一是数据隐私、安全性和监管合规性。因为担心数据泄露的问题,很多银行或机构都会回避利用人工智能的优势潜力,尤其是对于GPT-4这样的模型,在国内应用基本上是不太现实的问题。为了克服这一挑战并充分利用人工智能的力量,一个可行的办法是针对特定任务进行人工智能或大型语言模型(LLM)的微调,以确保数据安全地保存在

文章图片
#人工智能#语言模型
LangChain:使用自然语言查询数据库

在LLM模型还没有特别成熟,像现在这样火爆之前,我们对于数据库的传统理解方式依然还是建立在需要先去学习如如何使用SQL脚本来跟Database进行交互。这将需要花费你大量的时间和精力,而且随着时代的发展,数据库版本的升级迭代和新型的数据库产品的诞生,我们都需要快速的去适应。前几年随着云计算的火热,为了适应市场的需求,我们的产品需要去适配各大主流云厂商的DB产品;2022年开始在信创领域,也开始陆续

文章图片
#数据库
如何使用Hugging Face微调大语言模型(LLMs)

微调LLM时,了解你的使用场景和要解决的问题至关重要。这将帮助你选择合适的模型,或者帮助你创建一个数据集来微调你的模型。如果你还没有定义你的使用场景,你可能需要重新思考。并非所有的使用场景都需要微调,建议在微调你自己的模型之前,先评估和尝试已经微调过的模型或基于API的模型。例如,我们将使用以下使用场景:我们想要微调一个模型,它可以基于自然语言指令生成SQL查询,然后可以集成到我们的BI工具中。目

文章图片
#语言模型#人工智能#自然语言处理
GPT模型微调教程:打造您专属的ChatGPT模型

在具体介绍如何进行模型微调之前,我们需要先弄清楚模型微调和模型开发训练是完全不同的概念,在很多大语言模型发布的论文上会介绍模型训练的数据集规模,训练环境和推理时间,这些是说明模型从0训练推理到评估成熟的完整过程需要耗费的时间和成本,一般的个人或者公司几乎是很难承担这种费用投入的,而模型微调其实是指在已经训练好的模型基础上,通过进一步在自定义用例数据集上训练 GPT-3 的过程。通常用于提高模型的性

文章图片
RAG实战案例:如何基于 LangChain 实现智能检索生成系统

检索增强生成 (RAG) 是一种使用来自私有或专有数据源的信息来辅助文本生成的技术。它将检索模型(设计用于搜索大型数据集或知识库)和生成模型(例如大型语言模型 (LLM),此类模型会使用检索到的信息生成可供阅读的文本回复)结合在一起。通过从更多数据源添加背景信息,以及通过训练来补充 LLM 的原始知识库,检索增强生成能够提高搜索体验的相关性。这能够改善大型语言模型的输出,但又无需重新训练模型。

文章图片
#人工智能
    共 34 条
  • 1
  • 2
  • 3
  • 4
  • 请选择