logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MiniMind:3块钱成本 + 2小时!训练自己的0.02B的大模型。minimind源码解读、MOE架构

大模型在这个时代可以说无处不在了,但是LLM动辄数百亿参数的庞大规模。对于我们个人开发者而言不仅难以训练,甚至连部署都显得遥不可及。那 github 上 20k Star+ 的开源项目 minimind,声称仅用3块钱成本 + 2小时!即可训练出仅为25.8M的超小语言模型MiniMind。这不是谣言,此林已经帮你们试过了,AutoDL租用的 GPU 上训练(Pretrain + SFT有监督微调

文章图片
#python#人工智能#nlp
RAG深入解读:文本分块、混合检索、重排序、bge微调(工程落地实践)

大家好,我是此林。如今,我们惊叹 LLM 基模能力越来越强的同时,工程师越来越多地把目光转向了如何让 LLM 落地于实际生产中。比如 RAG 智能客服、知识库助手就一个落地案例。

文章图片
MiniMind:3块钱成本 + 2小时!训练自己的0.02B的大模型。minimind源码解读、MOE架构

大模型在这个时代可以说无处不在了,但是LLM动辄数百亿参数的庞大规模。对于我们个人开发者而言不仅难以训练,甚至连部署都显得遥不可及。那 github 上 20k Star+ 的开源项目 minimind,声称仅用3块钱成本 + 2小时!即可训练出仅为25.8M的超小语言模型MiniMind。这不是谣言,此林已经帮你们试过了,AutoDL租用的 GPU 上训练(Pretrain + SFT有监督微调

文章图片
#python#人工智能#nlp
MiniMind:3块钱成本 + 2小时!训练自己的0.02B的大模型。minimind源码解读、MOE架构

大模型在这个时代可以说无处不在了,但是LLM动辄数百亿参数的庞大规模。对于我们个人开发者而言不仅难以训练,甚至连部署都显得遥不可及。那 github 上 20k Star+ 的开源项目 minimind,声称仅用3块钱成本 + 2小时!即可训练出仅为25.8M的超小语言模型MiniMind。这不是谣言,此林已经帮你们试过了,AutoDL租用的 GPU 上训练(Pretrain + SFT有监督微调

文章图片
#python#人工智能#nlp
SpringBoot 手动实现动态切换数据源 DynamicSource (中)

dynamic-datasource-spring-boot-starter 是一个基于springboot的快速集成多数据源的启动器。其支持。JPA用户不建议使用,JPA自带事务,无法连续切库。

文章图片
#spring boot#后端#java
到底了