
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
SpringBoot+Vue全栈开发
Web技术基础:目前市面上的软件主要可分为两种:1.BS:(Browser/Server,浏览器/服务器架构模式),通过浏览器访问应用程序。2.CS:(Client/Server,客户端/服务器架构模式),通过客户端程序访问服务器。C/S架构主要特点是交互性强,具有安全访问模式,网络流量低,响应速度快,因为客户端负责大多数业务逻辑和UI演示,所以也被称为胖客户端,C/S结构的软件需要针对不同的操作

当AI学会了套路,却忘记了思考【当前成熟的解决方案的调研】
我用RTX 4060复现CoT微调,亲手“逼疯”一个大模型后,终于悟了!

当AI学会了套路,却忘记了思考【当前成熟的解决方案的调研】
我用RTX 4060复现CoT微调,亲手“逼疯”一个大模型后,终于悟了!

【LLM实战】手把手教你用小模型实现CoT(思维链)微调
思维链(Chain of Thought, CoT)是提升大模型推理能力的关键技术。很多人认为这需要巨大的模型和昂贵的硬件。本文将打破这一迷思,为你详细讲解CoT原理,并提供一套完整的、可在8GB显存(如RTX 4060)上流畅运行的代码,教你如何通过微调(Fine-tuning)让小模型也具备逻辑推理能力。

【LLM实战】手把手教你用小模型实现CoT(思维链)微调
思维链(Chain of Thought, CoT)是提升大模型推理能力的关键技术。很多人认为这需要巨大的模型和昂贵的硬件。本文将打破这一迷思,为你详细讲解CoT原理,并提供一套完整的、可在8GB显存(如RTX 4060)上流畅运行的代码,教你如何通过微调(Fine-tuning)让小模型也具备逻辑推理能力。

动手学深度学习 PyTorch版 学习笔记 (三)
**学习深度学习关键是动手**- 深度学习是人工智能最热的领域- 核心是神经网络- 神经网络是一门语言- 应该像学习Python/C++一样学习深度学习

到底了







