海海不掉头发个人主页

@qq_43055855

海海不掉头发

2022-09-29 18:03:49 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从零实现一个基于ReAct+RAG的智能问答Agent，我把踩过的坑都整理好了

大家好，我是一名正在学习大模型应用开发的研究生。最近跟着导师做了一个扫地机器人智能问答Agent的项目，用的是ReAct+RAG的技术方案。说实话，一开始我是懵的——什么ReAct、什么RAG、什么LangChain，听着都很高大上，但真的上手的时候，连环境都搭了半天。现在项目终于跑通了，我想着把整个过程整理成一篇博客，一方面是给自己做个总结，另一方面也希望能帮到和我一样刚入门的同学。毕竟我踩过的

#react.js #javascript #前端 +2

LLM从入门到实战：万字完整学习指南

文章摘要《LLM从入门到实战：2万字完整学习指南》系统介绍了大语言模型的核心知识体系。第一章讲解LLM基础概念，包括发展三阶段（统计模型→神经网络→Transformer）和核心评估指标（PPL、BLEU、ROUGE），并附代码实现。第二章详细解析三大主流架构：自编码模型（如BERT）、自回归模型（如GPT系列）和序列到序列模型（如T5），重点梳理GPT系列从预训练微调（GPT-1）到Zero-

#人工智能 #深度学习

【AI-大语言模型】医疗问诊AI大模型从0到1实战手册

《医疗问诊AI大模型从0到1实战手册》是一本面向AI开发者的实践指南，重点介绍如何从零开始构建医疗领域的对话系统。手册采用"预训练+微调"模式，基于GPT2等基础模型，通过医疗数据训练实现专业医疗问答功能。内容涵盖大模型核心概念（预训练、微调、归一化等）、开发流程详解、代码实现解析，并特别优化了在消费级显卡（如GTX 1650）上的训练方案。手册强调理论与实践结合，适合不同基础

#人工智能 #语言模型 #自然语言处理

新手也能懂！从0到1搞定大模型高效微调实战（附完整代码+踩坑记录）

这篇文章是一篇面向AI新手的实战教程，重点介绍了如何通过小样本学习和高效微调技术解决大模型训练中的三大痛点：高昂的标注成本、显存不足和入门门槛高。文章首先对比了传统全量微调与小样本方法的成本差异，强调只需63条标注数据就能达到90%以上的准确率。然后详细讲解了三种核心技术：BERT+PET（硬模板Prompt）、BERT+Prompt-Tuning（软模板Prompt）和ChatGLM+LoRA（

#人工智能 #深度学习 #语言模型 +3

【AI大模型实战项目】大模型入门实战：两个落地项目保姆级教程12月14日-【项目】基于知识库RAG的物流行业信息问答系统

本文介绍了两个适合大模型新手入门的实战项目：基于RAG的物流智能问答系统和基于P-tuning的新零售商品分类系统。文章首先分析了大模型的三大痛点（幻觉问题、知识过时、私有数据不安全）及对应的两大解决方案（RAG和轻量微调）。然后详细讲解了LangChain框架的六大核心组件（Models、Prompts、Chains等），通过代码示例展示了如何使用Ollama模型、构建提示词模板等基础操作。这些

#人工智能 #深度学习 #语言模型 +4

【毕业设计】-Java帝可得后台管理系统-结合若依Ai-框架-通义灵码-前后端分离项目开发-人工智能

演示地址：https://www.bilibili.com/video/BV1pf421B71v?spm_id_from=333.788.videopod.episodes&vd_source=2f1ec19ac9bc251863dc1c409be61ab4&p=22物联网（IoT：Internet of Things）简单来说，就是让各种物品通过互联网连接起来，实现信息的交换和通信。这个概念听起

#软件工程 #spring boot #java +2

【AI大模型学习基础篇】小白入门大模型全流程：从训练到MCP智能体

本文是一篇面向AI新手的保姆级大模型开发教程，详细介绍了从模型训练到智能体开发的全流程。文章选择通义千问(Qwen)作为基础模型，重点讲解了数据准备、LoRA+DeepSpeed微调、GPTQ量化、vLLM部署等关键技术环节，并展示了如何开发文本摘要工具和智能导游应用。教程特别强调了对硬件要求低的优化方案，如7B模型量化后仅需6G显存，使普通开发者也能完成大模型开发全流程。文章还对比了Qwen各代

#人工智能 #学习 #深度学习 +4

大模型入门-CSDN博客-AI基础篇

好了，这篇万字长文到这里就结束了。从 1943 年的第一个神经元模型，到现在能推理、能多模态的大模型，AI 用了 80 多年，才从一个科幻的概念，变成了我们每个人都能用到的工具。我花了一周的时间，把这些内容整理成这篇文章，就是希望能帮更多想入门大模型的朋友，少走弯路，不用再去看那些晦涩的论文，不用再被一堆术语搞懵。熟悉我的老粉都知道，我一直都是这样，把复杂的技术，用大白话讲给大家听。这次回来，就是

#人工智能

【计算机网络考研-408】——应用层——课程思维逻辑翻转课堂

“从抢优惠券到收情书，全靠这一层！”因为比如现在我们在电商APP上边或者各大型购物网站上边抢购限时优惠券，需要快速获取数据并且提交订单的话。需要使用的应用层的协议：有这两个协议主要用于传输网页内容和用户请求的过程。需优惠券信息通过HTTP协议从服务器传输到用户设备。用户点击“领取”按钮的时候，请求通过HTTP发送回服务器。其中：支持实时通信，用于实时更新优惠券库存状态（如 “已抢光” 提示）。

#计算机网络 #软件工程 #人工智能

手把手操作如何使用Idea开发工具手动创建第一个Springboot项目-（全网最详细的的操作步骤）--依赖jar包无法导入问题汇总--收藏篇

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开

#idea #intellij idea #bug +2

共 42 条

请选择