
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
当 AI 会写代码之后,程序员还值钱吗?——从 Harness Engineering 看角色升级
当 AI 会写代码之后,程序员还值钱吗?——从 Harness Engineering 看角色升级
【大模型应用开发】Claude Code Skills 开发实战:打造你的专属 AI 智能体
【大模型应用开发】Claude Code Skills 开发实战:打造你的专属 AI 智能体
【论文ing】强化学习重塑 NL2SQL:单轮对齐、多轮交互与细粒度评估的最新进展(2020–2026)
尽管存在数据与算力成本、训练稳定性、安全性与评测标准等挑战,现有工作已经清晰地表明:在复杂数据库环境下,单纯依赖一次性生成难以满足实际需求,RL 尤其是多轮交互式 RL,为构建更鲁棒、更智能的 NL2SQL agent 提供了新的技术路径。后续研究可以在奖励设计、多轮交互策略、细粒度评估框架以及小模型/资源受限场景等方向继续深入,为这一交叉领域提供更系统、更可落地的解决方案。
【Personal Skills】用系统思维看问题:结构、反馈与杠杆点
【Personal Skills】用系统思维看问题:结构、反馈与杠杆点
【大模型应用开发】Claude Code Skills 开发实战:打造你的专属 AI 智能体
【大模型应用开发】Claude Code Skills 开发实战:打造你的专属 AI 智能体
【大模型基础(2)】文本如何变成数字 — 分词、嵌入与位置信息
【大模型基础(2)】文本如何变成数字 — 分词、嵌入与位置信息
【大模型基础(1)】大模型概述
【大模型基础(1)】大模型概述
【强化学习基础(4)】强化学习中的泛化:函数近似与深度强化学习
【强化学习基础(4)】强化学习中的泛化:函数近似与深度强化学习

【HDFS运维】HDFS回收箱机制:原理、配置、配置可能导致的问题分析
【HDFS运维】HDFS回收箱机制:原理、配置、配置可能导致的问题分析

【大模型应用极简开发入门(2)】GPT模型简史:从GPT-1到GPT-4:从小数据量的微调到大数据量的强化学习不断优化模型
【大模型应用极简开发入门(2)】GPT模型简史:从GPT-1到GPT-4:从小数据量的微调到大数据量的强化学习不断优化模型








