logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MemTensorMemOS首个AI记忆操作系统

是五官:负责听和看。mem_cube是血液细胞:包裹着氧气(数据)在全身流动。是心脏:控制血液流动的节奏(快慢车道)。mem_infra是大脑皮层:负责物理存储记忆。是睡眠机制:在休息中整理记忆,遗忘琐事。这套系统让 MemOS 不仅仅是一个“存东西的地方”,而是一个活的、会呼吸、会遗忘的操作系统。解决了“多源异构数据难以索引”的工程难题。在没有 MemCube 之前,想要把“一张图片”、“一段聊

文章图片
#人工智能#语言模型#回归 +1
deepseek-ai Janus-Pro-7B模型深入解析

是施工蓝图:它规定了模型有两只眼睛(理解/生成),虽然共用一个大脑。是全能大脑:它存储了逻辑推理、视觉审美和语言常识的所有经验。是翻译官:它确保外部输入的图片和文字能被转化为大脑理解的标准格式。tokenizer和是外周神经:负责最初的信号采集和最后的信号还原。它可以直接根据当前的对话上下文(文本)和环境观察(图像),在同一个潜空间内做出决策并直接生成视觉反馈,极大提高了多模态 Agent 的响应

文章图片
#人工智能#语言模型#图像处理 +1
ByteDance-SeedBAGEL-7B-MoT模型深入解析

是图纸。是全能大脑(负责思考和规划画面)。是眼睛和手(负责看清图片和画出最终像素)。tokenizer系列是嘴巴和耳朵(负责听懂命令和说话)。这一套系统紧密配合,实现了从理解意图到生成像素的端到端流程。MoT解决了“全能”带来的效率和干扰问题(大脑分区)。双编码器解决了“理解”与“生成”的精度矛盾(眼手协调)。涌现能力是上述架构在大规模数据训练后产生的“质变”(产生了物理直觉)。Agent 不直接

#图像处理#人工智能#语言模型 +1
到底了