logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从零手搓大模型之路(二、手搓一个RAG)

第二堂是动手构建一个Tiny-RAG,也就是RAG的简化版本,只包含RAG的核心功能Retrieval和Generation。整体看完源码,并听完相应的视频讲解,内容感觉还算是很容易明白,本博文记录下自己感觉相对重要的以及一些思考(持续补充)。Tiny-RAG构建检索增强生成技术(Retrieval-Augmented Generation,RAG),它的出现主要是解决大模型的“幻觉”问题,即当询

文章图片
#语言模型
DeepSeek应用——结合即梦AI文生图

记录自己学习应用DeepSeek的过程,使用的是满血版671B的DeepSeek......(举一反三,这个不单单是可以用在DeepSeek,所有市面上的模型都可以模拟进行替换)说实话这个真的是特别简单,无非就是两个已经成熟的软件之间的配合使用:先用DeepSeek生成提示词,之后拿提示词去即梦AI去文生图。不过倒是提供一个思路,之后会尝试使用本地部署的SD进行文生图,使用本地部署的TTS进行语音

从零手搓大模型之路(一、学习Qwen模型架构)

五月,依旧是给自己挖坑,参加了DataWhale的五月自学课堂(从零手搓大模型实战)。说是从零手搓,但深知自己远远没有大佬水平,达不到研究透透的程度,所以也就是看源码了解下内部逻辑,简简单单写写心得,期望有朝一日也能成为大佬。So,今天挖的坑让明天的自己哭着来填(哭?哭也是要算时间的!。饭得一口一口吃,路得一点一点走。从零手搓大模型Qwen2逐行代码分析本博文里面图来源于课程链接。开卷开卷!(怎么

#语言模型
从零手搓大模型之路(一、学习Qwen模型架构)

五月,依旧是给自己挖坑,参加了DataWhale的五月自学课堂(从零手搓大模型实战)。说是从零手搓,但深知自己远远没有大佬水平,达不到研究透透的程度,所以也就是看源码了解下内部逻辑,简简单单写写心得,期望有朝一日也能成为大佬。So,今天挖的坑让明天的自己哭着来填(哭?哭也是要算时间的!。饭得一口一口吃,路得一点一点走。从零手搓大模型Qwen2逐行代码分析本博文里面图来源于课程链接。开卷开卷!(怎么

#语言模型
DeepSeek应用——结合即梦AI文生图

记录自己学习应用DeepSeek的过程,使用的是满血版671B的DeepSeek......(举一反三,这个不单单是可以用在DeepSeek,所有市面上的模型都可以模拟进行替换)说实话这个真的是特别简单,无非就是两个已经成熟的软件之间的配合使用:先用DeepSeek生成提示词,之后拿提示词去即梦AI去文生图。不过倒是提供一个思路,之后会尝试使用本地部署的SD进行文生图,使用本地部署的TTS进行语音

从零手搓大模型之路(一、学习Qwen模型架构)

五月,依旧是给自己挖坑,参加了DataWhale的五月自学课堂(从零手搓大模型实战)。说是从零手搓,但深知自己远远没有大佬水平,达不到研究透透的程度,所以也就是看源码了解下内部逻辑,简简单单写写心得,期望有朝一日也能成为大佬。So,今天挖的坑让明天的自己哭着来填(哭?哭也是要算时间的!。饭得一口一口吃,路得一点一点走。从零手搓大模型Qwen2逐行代码分析本博文里面图来源于课程链接。开卷开卷!(怎么

#语言模型
DeepSeek应用——结合即梦AI文生图

记录自己学习应用DeepSeek的过程,使用的是满血版671B的DeepSeek......(举一反三,这个不单单是可以用在DeepSeek,所有市面上的模型都可以模拟进行替换)说实话这个真的是特别简单,无非就是两个已经成熟的软件之间的配合使用:先用DeepSeek生成提示词,之后拿提示词去即梦AI去文生图。不过倒是提供一个思路,之后会尝试使用本地部署的SD进行文生图,使用本地部署的TTS进行语音

DeepSeek应用——结合即梦AI文生图

记录自己学习应用DeepSeek的过程,使用的是满血版671B的DeepSeek......(举一反三,这个不单单是可以用在DeepSeek,所有市面上的模型都可以模拟进行替换)说实话这个真的是特别简单,无非就是两个已经成熟的软件之间的配合使用:先用DeepSeek生成提示词,之后拿提示词去即梦AI去文生图。不过倒是提供一个思路,之后会尝试使用本地部署的SD进行文生图,使用本地部署的TTS进行语音

到底了