logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

知识图谱 方法、实践与应用 王昊奋 读书笔记(下)

知识图谱 读书笔记 知识图谱推理 语义搜索 KQBA 知识图谱问答

#知识图谱#人工智能
【阿里DeepResearch】Agentic CPT持续预训练

通过持续预训练,提升后续sft潜能。

文章图片
知识图谱 方法、实践与应用 王昊奋 读书笔记(上)

知识图谱 方法、实践与应用读书笔记 知识存储 规则挖掘 知识融合

#知识图谱#人工智能
数据可视化 数据分析 常用图 seaborn

数据分析阶段常用的统计图,验证数据分布,发现数据之间的关系,进行异常值检测。

#python#数据挖掘
【大模型-金融】Trading-R1 多阶段课程学习

作者指出,现有方法存在两大缺陷:通用LLM缺乏金融领域的结构化推理能力,而纯量化模型又缺乏可解释性。为此,论文提出了Trading-R1框架,通过一个“由易到难”的三阶段课程学习,结合监督微调(SFT)与强化学习(RL),成功训练出一个4B参数的开源模型,其在回测中表现优于GPT-4.1等闭源巨头。

#金融#学习
【agent】大模型决策规划-游戏

利用千问模型,对人类游戏对局数据进行自动标注,通过sft+RL训练,教会模型打游戏。

文章图片
#人工智能
    共 74 条
  • 1
  • 2
  • 3
  • 8
  • 请选择