夜信431 个人主页

@weixin_73790979

夜信431

2023-10-17 20:52:29 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

用RL(强化学习)优化LLM的代码实践！手把手教学逐步递进（持续更新，点赞收藏关注~）

最近Deepseek的r1模型在国内外火的没边，也是借着这股东风，想要深入了解一下RL对于LLM的增强效果到底有多强！在大语言模型（LLM）的应用中，我们也经常会遇到模型输出质量不稳定的问题。有时候回答过于简单，缺乏具体细节；有时候又过于发散，难以聚焦核心内容。本实验旨在探索如何通过强化学习（特别是PPO算法）来优化LLM的输出质量。

#python #语言模型 #bert +2

CCF-CSP考试基础备考讲解、实战向的解题技巧--冲锋2025年3月认证！！！

立即实践「调试加速三板斧」，从今天开始每道题都使用。

#数据结构 #算法 #动态规划

一文讲明白RAG 与 KAG 的区别：自然语言处理中的知识增强方法对比

RAG（检索增强生成）是一种结合检索和生成模型力量的框架。它已成为生成式人工智能最重要的应用之一，将外部文档（PDF、视频等）连接到 LLM 以进行问答案例。查询通过检索系统，从外部知识源检索相关文档或段落。将这些检索到的段落作为上下文纳入生成模型（如 GPT-4 或 Gemini），模型综合信息以生成相关答案。其应用多种多样，从回答开放领域查询或需要访问最新或特定领域信息的聊天机器人，到定制搜索

#自然语言处理 #人工智能 #深度学习 +1

从DeepSeek爆火看知识蒸馏：如何让小模型拥有大模型的智慧？-- 附完整运行代码

最近国产大模型DeepSeek（深度求索）突然爆火，开源模型在多项评测中超越O1的表现令人惊叹。但更值得关注的是，其实很多我们熟知的大模型这都是知识蒸馏技术的杰作哦，然后我就好奇到底怎么实现的模型蒸馏，上网查阅之后发现没有比较好的代码教学，那么这里我就写一个简单的快速体验蒸馏模型威力的代码示例供大家交流学习讨论。A：温度太高会像过度放大的地图，失去关键细节，一般2-5之间效果最佳。A：就像抄答案

#深度学习 #人工智能

从DeepSeek爆火看知识蒸馏：如何让小模型拥有大模型的智慧？-- 附完整运行代码

#深度学习 #人工智能

CCF-CSP考试基础备考讲解、实战向的解题技巧--冲锋2025年3月认证！！！

立即实践「调试加速三板斧」，从今天开始每道题都使用。

#数据结构 #算法 #动态规划

从DeepSeek爆火看知识蒸馏：如何让小模型拥有大模型的智慧？-- 附完整运行代码

#深度学习 #人工智能

告别繁琐：爬虫新宠 crawl4ai，数行代码搞定数据采集！-- 附多种场景完整代码示例！

在数据驱动的时代，网络爬虫已经成为我们获取信息的重要工具。但传统的爬虫框架往往需要编写大量的代码，让人偶尔让人恶心至极。的出现，让 Python 爬虫开发变得更加简单高效。它以其简洁的 API、强大的功能和灵活的配置选项，成为了爬虫开发的新宠。无论是简单的数据采集，还是复杂的网页交互，既然简单我也没有必要给大家介绍那么多，大家也不乐意看，我只简单说一下它的特点，咱们直接给出来可运行的代码！，它以其

#爬虫

从AI编程到网站上线：一个业余开发者的踩坑实录与深度反思

作为一个长期依赖AI编程的非专业开发者，我曾坚信「代码生成工具+个人创意」就能快速实现项目落地。然而最近用24小时上线「周末灵感转盘」网站的经历，却让我对AI辅助开发产生了复杂认知——这场与传统开发流程的正面交锋，暴露了技术捷径背后的隐性成本。

#人工智能 #深度学习 #python +2

自学成才之路，DeepSeek R1 论文解读

用最强的gemini2.0来分析最火的deepseek R1会如何呢？讲解真的很有意思！

#人工智能 #深度学习 #语言模型

共 12 条

请选择