
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
《公共知识互惠协议(PKRP)》草案提出应对AI时代开源知识保护的新框架。该协议指出传统开源许可证(如GPL)基于的三大假设(代码离散性、可追踪性和清晰边界)在AI时代已失效,导致公共知识池面临枯竭、维护者被剥削和权力集中三大危险。协议核心转向"利益分配"而非"代码管控",提出五大原则:商业获利者需回馈公共基金、重点资助维护者而非原作者、AI开发者承担特殊义

摘要:AI时代税制重构——从人力税到算力税 现代财政体系建立在人力劳动征税基础上,但随着AI大规模替代智力劳动,传统税制面临失效风险。本文提出转向"算力税"的新财政框架: 问题本质:AI创造"幽灵GDP"——产出增长但绕过人类收入循环,导致税基萎缩。白领岗位替代将引发消费经济连锁反应,且缺乏自我修复机制。 解决方案:对AI核心生产资料(GPU/算力)征税,采
视觉压缩方法存在根本性缺陷:注意力粒度退化。文本LLM可精确关注单个词,但视觉压缩后,模型只能以"视觉块"为单位处理信息,无法聚焦到具体词汇。这导致三个问题:1) 词级定位能力丧失;2) 跨块推理困难;3) 无法模拟人类非均匀阅读模式。论文数据表明,压缩比越高性能越差,长文本任务退化尤为明显。虽然通过提高分辨率可缓解,但本质是信息可访问性(而非信息量)的损失,类似压缩文件需整体

清华与智谱的论文提出了一种创新的长文本处理方法——将文本渲染为图片后让AI读取,比传统逐字处理更高效。核心方法包括三步:持续预训练模型识别图片文字,用GPT-4优化渲染参数组合(如分辨率、字体),以及后训练微调模型性能。实验显示,该方法能以3-4倍压缩比处理文本,且速度提升4.8倍,性能优于传统模型。与DeepSeek-OCR的离线批量处理不同,Glyph方案更注重实时交互的高精度需求,二者分别代

本文提出了一种新型代码智能体(Yi式代码Agent)的设计框架,通过重构传统代码生成模型的几何结构,将单一的大语言模型分解为多模块协同的系统。该框架包含:1)三层世界模型(P):需求/代码/项目图建模;2)多层验证机制(V):从语法检查到灰度测试的递进式验证链;3)分级可回滚行动(A):将代码修改分解为提案-审查-应用的可逆流程;4)任务路由机制:为不同任务类型匹配最优P-V-A组合。这种结构化设

人类记忆采用动态多层缓存架构,从工作记忆(L0)到长期固化缓存(L2)再到原始存储(L3),形成速度与持久性平衡的记忆系统。关键特性包括: 按使用频率自动分级缓存 从完全生成到固化调取逐步演进 采用复合淘汰策略(使用频率+重要性+情感权重) 各层对应不同神经机制(神经活动→突触改变→网络结构) 这对AI系统的启示是应构建动态缓存层次:会话级暂存(L1)、热点固化(L2)配合原始数据生成(L3),在

人类记忆与AI记忆本质上是基于线索的动态生成过程,而非静态存储。核心观点包括: 存储配方而非内容:大脑仅存储关键词、关联和情感标记(占信息量1-2%),而非完整摘要,查询时通过激活线索实时重构信息。 上下文敏感生成:同一组线索能根据不同需求(如解释概念或推导过程)生成差异化的动态摘要,且允许有损但保留核心语义。 分层动态合成:回忆遵循从粗糙到精细的渐进生成,类似算法解压,实现存储效率与灵活性的平衡

本文探讨了人类记忆机制与当前AI模型的差异,提出改进AI记忆系统的三个关键启示。首先指出人类记忆是生成式的分层重构过程,而非精确检索;其次揭示记忆采用有损压缩+索引的存储方式;最后分析记忆检索的分层加速特性。基于此,文章提出三点AI改进方向:1)放弃将全部内容装入工作记忆的尝试,采用层次索引;2)用关联导航替代扁平化注意力机制;3)允许记忆重构而非强求完美保真。最后设计了两个具体方案:层次索引记忆

摘要 当前AI发展面临数据瓶颈:合成数据存在多样性退化问题,导致"模型崩溃";互联网文本数据可能接近耗尽。然而,视频、音频等多模态数据仍未被充分利用,其蕴含的物理常识和空间推理远超文本。未来突破方向包括:合成与真实数据混合使用、精准生成缺失数据、进化式数据生成等新范式,以及深度开发视频数据资源和创新数据增强技术。关键在于从追求数据数量转向质量,充分挖掘现有数据的多维价值。








