
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
我们为你精选了 5 本兼具深度与实用性的 AI 工程书籍,覆盖从底层原理到云端部署的完整知识链。无论你是刚入门的新手,还是希望进阶的工程师,这些书都值得一读。

今天,让我们深入剖析RAG技术的方方面面,从基础概念到高级优化,从理论原理到实战案例,帮你构建真正可用的企业级AI知识系统。

Unsloth是一个专注于加速大语言模型微调过程的开源项目。它通过一系列底层优化,显著提升了微调速度并大幅降低了内存消耗,同时能保持模型性能。无论是研究者还是开发者,都能借助Unsloth更高效地定制自己的大语言模型。

Multi-Agent 的价值就在这里:把“复杂问题”变成“多人协作问题”,用架构把能力放大、把流程跑顺、把结果稳定下来。

在LLM中影响词汇的分布主要通过两种方式,一种是通过提示(Prompting),另外一种就是通过训练(Training)。提示是影响词汇分布最简单的方法,通过给LLM输入提示文本(有时会包含指令和示例)使得词汇的分布概率发生变化。
昨天看到腾讯研究院发布的《腾讯发布业界首份行业大模型调研报告:向 AI 而行,共筑新质生产力》(),读下来,很有收获,推荐大家看看原文,其中有些重点可以看看。行业大模型的构建和应用中,由于需求和目标不同,技术实现复杂性差异也较大。通过调研总结,目前机构在使用大模型适配行业应用过程中,从易到难主要有提示工程、检索增强生成、精调、预训练四类方式。在机构的具体实践中,通常不会只用一种方式,而会组合使用,

尽管大模型非常强大,但仍然有着自身的局限。大模型可以生成看起来非常值得信赖的内容并引用外部资源,但是,大模型本身并不能直接访问互联网也不能访问互联网的资源。

看过前面文章的朋友们,应该还记得一句话,那就是prompt是应用程序跟大模型交互的唯一通道。作为与AI交流的桥梁,Prompt Engineering(提示工程)正在成为一个非常值得关注的领域。

LLaMA-Factory 是一个国内北航开源的低代码大模型训练框架,专为大型语言模型(LLMs)的微调而设计

人工智能大模型的三个核心支柱1、原始数据(raw data) 2、算力(ability of computing)3、算法(algorithm)







