logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型入门-CSDN博客-AI基础篇

好了,这篇万字长文到这里就结束了。从 1943 年的第一个神经元模型,到现在能推理、能多模态的大模型,AI 用了 80 多年,才从一个科幻的概念,变成了我们每个人都能用到的工具。我花了一周的时间,把这些内容整理成这篇文章,就是希望能帮更多想入门大模型的朋友,少走弯路,不用再去看那些晦涩的论文,不用再被一堆术语搞懵。熟悉我的老粉都知道,我一直都是这样,把复杂的技术,用大白话讲给大家听。这次回来,就是

文章图片
#人工智能
【计算机网络考研-408】——应用层——课程思维逻辑翻转课堂

“从抢优惠券到收情书,全靠这一层!”因为比如现在我们在电商APP上边或者各大型购物网站上边抢购限时优惠券,需要快速获取数据并且提交订单的话。需要使用的应用层的协议:有这两个协议主要用于传输网页内容和用户请求的过程。需优惠券信息通过HTTP协议从服务器传输到用户设备。用户点击“领取”按钮的时候,请求通过HTTP发送回服务器。其中:支持实时通信,用于实时更新优惠券库存状态(如 “已抢光” 提示)。

文章图片
#计算机网络#软件工程#人工智能
手把手操作如何使用Idea开发工具手动创建第一个Springboot项目-(全网最详细的的操作步骤)--依赖jar包无法导入问题汇总--收藏篇

系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开

#idea#intellij idea#bug +2
【已解决】Maven项目 jar包下不下来-Downloading plugin for ‘项名’----Reimport allmavenprojct刷新无效果----org.apache包下载失败

问题描述:原因分析:1.mavenLib -下的-org-maven下有残余文件。2.网速太慢问题导致连接不上。3.VM options for importer 下没有ssl。解决方案:1.需要删除mavenLib --下的org-maven残余文件。2.想要配置一下 VM options-Dmaven.wagon.http.ssl.insecure=true -Dmaven.wagon.htt

#intellij idea#idea#bug +1
【已解决】谷歌浏览器打开默认桔梗导航更改主页仍解决不了http://dkddceeeeh.jumpkj.chuairan.com/index.html-----

项目场景:打开谷歌浏览器问题描述:谷歌浏览器主页非法被篡改。原因分析:下载了不知名的流氓软件导致的主页非法被篡改。解决方案:1… 桌面找到谷歌浏览器快捷方式,右键–>属性。将"chrome.exe”后面的链接删掉(包括空格),然后点击应用,确定。(但是我点击"确认"时,提示权限不足;)2.如果是第二种办法提示权限不足,则先找到浏览器安装目录,然后再桌面上删除谷歌浏览器的快捷方式,之后再重新将

#bug#chrome#安全 +1
【AI大模型实战项目】大模型入门实战:两个落地项目保姆级教程12月14日-【项目】基于知识库RAG的物流行业信息问答系统

本文介绍了两个适合大模型新手入门的实战项目:基于RAG的物流智能问答系统和基于P-tuning的新零售商品分类系统。文章首先分析了大模型的三大痛点(幻觉问题、知识过时、私有数据不安全)及对应的两大解决方案(RAG和轻量微调)。然后详细讲解了LangChain框架的六大核心组件(Models、Prompts、Chains等),通过代码示例展示了如何使用Ollama模型、构建提示词模板等基础操作。这些

文章图片
#人工智能#深度学习#语言模型 +4
【AI大模型基础篇】从零开始学AI大模型与AIGC:小白保姆级教程

本文是一篇面向零基础读者的AI大模型与AIGC入门指南。文章首先解释了AIGC(AI生成内容)的概念及其应用场景,包括内容孪生、内容编辑和内容生成三大类,涵盖文本、图像、音频、视频等多种形式。随后分析了AIGC产业的三层结构:基础层(大厂研发大模型)、中间层(行业专用模型)和应用层(面向用户的产品)。接着重点介绍了当前最热门的AI绘画技术,梳理了从VAE、GAN到Diffusion Model三代

文章图片
#人工智能#深度学习#语言模型 +4
【AI大模型学习基础篇】小白入门大模型全流程:从训练到MCP智能体

本文是一篇面向AI新手的保姆级大模型开发教程,详细介绍了从模型训练到智能体开发的全流程。文章选择通义千问(Qwen)作为基础模型,重点讲解了数据准备、LoRA+DeepSpeed微调、GPTQ量化、vLLM部署等关键技术环节,并展示了如何开发文本摘要工具和智能导游应用。教程特别强调了对硬件要求低的优化方案,如7B模型量化后仅需6G显存,使普通开发者也能完成大模型开发全流程。文章还对比了Qwen各代

文章图片
#人工智能#学习#深度学习 +4
新手也能懂!从0到1搞定大模型高效微调实战(附完整代码+踩坑记录)

这篇文章是一篇面向AI新手的实战教程,重点介绍了如何通过小样本学习和高效微调技术解决大模型训练中的三大痛点:高昂的标注成本、显存不足和入门门槛高。文章首先对比了传统全量微调与小样本方法的成本差异,强调只需63条标注数据就能达到90%以上的准确率。然后详细讲解了三种核心技术:BERT+PET(硬模板Prompt)、BERT+Prompt-Tuning(软模板Prompt)和ChatGLM+LoRA(

文章图片
#人工智能#深度学习#语言模型 +3
新手也能懂!从0到1搞定大模型高效微调实战(附完整代码+踩坑记录)

这篇文章是一篇面向AI新手的实战教程,重点介绍了如何通过小样本学习和高效微调技术解决大模型训练中的三大痛点:高昂的标注成本、显存不足和入门门槛高。文章首先对比了传统全量微调与小样本方法的成本差异,强调只需63条标注数据就能达到90%以上的准确率。然后详细讲解了三种核心技术:BERT+PET(硬模板Prompt)、BERT+Prompt-Tuning(软模板Prompt)和ChatGLM+LoRA(

文章图片
#人工智能#深度学习#语言模型 +3
    共 37 条
  • 1
  • 2
  • 3
  • 4
  • 请选择