
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
知识图谱 方法、实践与应用 王昊奋 读书笔记(下)
知识图谱 读书笔记 知识图谱推理 语义搜索 KQBA 知识图谱问答
【阿里DeepResearch】Agentic CPT持续预训练
通过持续预训练,提升后续sft潜能。

知识图谱 方法、实践与应用 王昊奋 读书笔记(上)
知识图谱 方法、实践与应用读书笔记 知识存储 规则挖掘 知识融合
数据可视化 数据分析 常用图 seaborn
数据分析阶段常用的统计图,验证数据分布,发现数据之间的关系,进行异常值检测。
【阿里DeepResearch】SailorFog-通过高质量SFT训练具备推理能力的Web Agent
通过高质量sft与rl,提升模型推理能力

【阿里DeepResearch】SailorFog-通过高质量SFT训练具备推理能力的Web Agent
通过高质量sft与rl,提升模型推理能力

【大模型-写作】LLMxMapReduce-V2 自动修改大纲 生成高质量文章
利用大模型 迭代进行高质量文本创作。

【大模型-金融】Trading-R1 多阶段课程学习
作者指出,现有方法存在两大缺陷:通用LLM缺乏金融领域的结构化推理能力,而纯量化模型又缺乏可解释性。为此,论文提出了Trading-R1框架,通过一个“由易到难”的三阶段课程学习,结合监督微调(SFT)与强化学习(RL),成功训练出一个4B参数的开源模型,其在回测中表现优于GPT-4.1等闭源巨头。
【大模型写作】DeepWriter 8B小模型逆向推理,提升开放域创作能力
大模型写作,提升开放领域写作效果

【agent】大模型决策规划-游戏
利用千问模型,对人类游戏对局数据进行自动标注,通过sft+RL训练,教会模型打游戏。
