
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在深度学习领域中,已经经过验证的成熟算法,目前主要有深度卷积网络(DNN)和递归网络(RNN),在图像识别,视频识别,语音识别领域取得了巨大的成功,正是由于这些成功,能促成了当前深度学习的大热。

那天下午,我盯着屏幕发了十分钟呆。我打开那段代码,Spring Boot的结构,Controller、Service层分离得很规范,注释也有,逻辑基本跑得通。我沉默了大概30秒。那一刻不是愤怒,是恐惧,是一种职业生涯第一次真实感受到的、从脚底升上来的恐惧。

某些场景下可能希望构建一个完全本地离线可用的大模型,方法很多,模型也很多,比如 qwen、qwen2、llama3等,最简单快捷的首推使用 ollama 部署,模型选用 qwen 或 qwen2,针对中文任务效果更好。

今天介绍一个 AI 基于多智能体大语言模型的中文金融交易决策框架。—— TradingAgents-CN
而今天要介绍的开源项目 Happy-LLM,正是为解决这些问题而生。它由国内知名开源学习社区 Datawhale China 发起,目标明确:让每个人都能“快乐地”学习大模型。
《大语言模型能力来源与边界》是由复旦大学张奇团队撰写的研究报告,该报告主要围绕大语言模型(LLM)的能力来源、边界以及相关的理论研究和实验结果进行探讨,涵盖了从模型基础理论、能力边界、推理能力、工具调用评测到代码生成、翻译偏好建模等多方面的内容。

Ollama 是一款开源跨平台大模型工具,主要用于在本地便捷部署和运行大型语言模型(LLM),核心目标是降低用户使用大模型的门槛,同时保障数据隐私。
最近发现一个非常好的学习资料,可以一次性的掌握从理论到从头创建一个大模型,再到预训练,SFT(有监督微调),甚至到最后还有RAG以及Agent的搭建方式,非常的齐全。就是这个Happy-LLM,Github将近10000星了,上升势头非常快。这边大模型的开源项目已经整理并打包好了,大家扫了即可拿到由于下个学期可能需要讲一些类似的内容,所以自己过了一遍,教程一共有7章,我把它分成了三个部分:1-4理

大语言模型综述文章《A Survey of Large Language Models》团队终于出书啦!而且是中文版——《大语言模型》!这本书整理呈现了大模型技术框架和路线图,是一本非常好的入门书籍。

今天,我将为你隆重介绍一个在GitHub上爆火的开源项目——《Happy-LLM》!该项目由知名AI开源社区Datawhale发起,开源仅一周,GitHub star数量就突破了2.3k,被誉为大模型学习圈的“顶流教程”!







