logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

全栈大模型微调框架LLaMA Factory:100多个国内外大模型微调落地教程

本次分享将从大模型高效训练的角度详细剖析LLaMA Factory的构建动机与组成模块,包括上百种大模型的全栈微调适配原理,LoRA算子优化加速方法,多种微调Trick集成思路等等。

#人工智能#自然语言处理#深度学习 +1
【LLM大模型】谷歌AI杰玛Gemma大模型开源了!附2个本地部署安装教程和实例

Gemma 模型可在您的应用以及硬件、移动设备或托管服务上运行。您还可以使用调参技术自定义这些模型,使其在执行对您和您的用户至关重要的任务方面表现卓越。

文章图片
#人工智能#深度学习#自然语言处理
从知识图谱到 GraphRAG:探索属性图的构建和复杂的数据检索实践

本文将探索属性图及其在提升数据表示和检索中的作用,同时借鉴 Ravi Theja(LlamaIndex AI 工程师和布道师)关于属性图的系列内容。

#知识图谱#人工智能#深度学习 +2
【LLM大模型】为什么说知识图谱 + RAG > 传统 RAG?

本文从知识图谱的原理等角度,结合一个 GraphRAG 的生动类比,说明了为什么知识图谱+RAG 的方案优于传统的 RAG 方案。

#知识图谱#人工智能#深度学习 +2
LLM 大模型学习必知:提示词工程-Prompt Engineering

Prompt Engineering提示工程(Prompt Engineering)是一项通过优化提示词(Prompt)和生成策略,从而获得更好的模型返回结果的工程技术。

文章图片
#人工智能#自然语言处理#深度学习 +1
【LLM大模型】AI Meta Llama-3.1介绍

这款开源人工智能模型,你可以进行微调、蒸馏并在任何地方部署。最新的指令调优模型有8B、70B和405B版本可供选择。

文章图片
#人工智能#深度学习#自然语言处理 +1
如何通过知识图谱+大语言模型提高本地问答系统准确性

将知识图谱的小颗粒数据与原先人工处理的大块数据相结合,我们可以更好地搜索需要全局 / 跨节点上下文的查询,我们通过知识图谱把大模型的推理能力和知识点分开,目前LangChain和Llama Index均支持将嵌入式向量和知识图谱结合来解决剩下30%的应用场景。

#知识图谱#语言模型#深度学习 +2
到底谁才是国产中文大模型第一巴图鲁?测试的结果我不敢说

看结果,和你们的直觉一样么?你们觉得国产中文大模型第一巴图鲁是谁?你经常用哪家?可以在留言区分享讨论。

#dubbo#人工智能#自然语言处理
Agentic AI 的 17 种模式及其在下一代大规模 AI 系统中的价值

当你构建一个大规模AI系统时,你其实是在把不同的代理设计模式组合起来。每个模式都有自己的阶段、构建方法、输出和评估。

文章图片
#人工智能#自然语言处理
    共 1715 条
  • 1
  • 2
  • 3
  • 172
  • 请选择