love you joyfully 个人主页

@weixin_60223645

love you joyfully

研究智能感知及其决策提升

西安

2023-01-01 15:11:50 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

提供人工智能及强化学习基础网络设计及知识传递服务

巨头争霸赛：Claude Fable 5 vs GPT-5.5——算法创意能力评测

6.10凌晨1点，Claude发布了Fable 5，号称是Claude向大众发布过的能力最强的模型。Fable 5属于Mythos系列，只是为了大众使用，在安全上做了一些限制。

Agent时代的Individual Research，什么是我们能把握的？

**从 2024 年底到 2026 年春天，不到一年半的时间，科研，尤其是对于独立研究工作者，这件事已经跟过去完全不是一回事了。****如果要在整个科研史上画一条分界线，2024 年底可能算一条。那之前，AI 是"辅助"：是 Copilot 帮着补全一行代码，是 ChatGPT 帮着润色一段英文。那之后，AI 开始变成"主角"：它写代码，复现论文，跑实验，一次性读完整个代码仓库，然后指出里面某个算

#人工智能

巨头争霸赛：Claude Fable 5 vs GPT-5.5——算法创意能力评测

6.10凌晨1点，Claude发布了Fable 5，号称是Claude向大众发布过的能力最强的模型。Fable 5属于Mythos系列，只是为了大众使用，在安全上做了一些限制。

巨头争霸赛：Claude Fable 5 vs GPT-5.5——算法创意能力评测

6.10凌晨1点，Claude发布了Fable 5，号称是Claude向大众发布过的能力最强的模型。Fable 5属于Mythos系列，只是为了大众使用，在安全上做了一些限制。

手把手沉浸式训练一个迷你大模型：预训练+SFT+ PPO/RLHF

如果你第一次听到“训练大模型”，脑海里可能会自动浮现一排显卡、嗡嗡作响的机房、以及一张看起来不太友好的云账单。好消息是：我们今天不训练一个真正能上生产的 ChatGPT，也不挑战算力预算的物理极限。我们要做的是把大模型训练流程缩小成一个可以亲手跑通的“训练沙盘”。

#人工智能

手把手沉浸式训练一个迷你大模型：预训练+SFT+ PPO/RLHF

#人工智能

手把手沉浸式训练一个迷你大模型：预训练+SFT+ PPO/RLHF

#人工智能

我的创作纪念日——聊聊我想成为一个创作者的动机

2025年6月4日，是我在CSDN写下第一篇技术博客的第1024天。1024，这个数字对于程序员来说意义非凡，它不仅是内存单位的基础，更是我们这群“码农”的节日符号。而对我来说，它更像是一段旅程的里程碑：从一个曾想过本科毕业直接就业的本科生，到现在人工智能方向博士生，我在这条创作与探索的路上，已经走了整整1024天。这1024天里，我写过Matlab命令整理、Python算法实现、深度学习模型搭建

#经验分享

多智能体新范式：当量子计算遇见社交博弈

摘要：两项研究突破多智能体系统瓶颈：① Q-CMAPO框架创新融合量子计算与经典强化学习，通过量子电路编码策略（QAOA算法）提升高维动作空间探索效率，经典评价器保障执行稳定性，在无人机协同等场景实现高效收敛；② 自博弈对话模型揭示团队协作"平庸化"机制，单一模型通过自博弈训练同时扮演多角色，低成本涌现社交智能（如同理心），为多智能体交互提供新范式。两项工作分别从量子计算底层

#量子计算 #人工智能

Agent时代的Individual Research，什么是我们能把握的？

#人工智能

共 23 条

请选择