logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

RiT 这篇论文说明了:图像生成不一定要先在像素里死磕

【摘要】RiT论文提出了一种创新的图像生成方法,通过优化表示空间而非模型架构来提升生成效果。研究发现,DINOv2等表示空间具有更优的几何特性,能显著简化生成任务。该方法采用冻结表示提取器,在合适的表示空间中训练轻量级生成模型,实现了更稳定高效的生成效果。对开发者而言,该研究强调表示空间选择的重要性,表明优化输入空间可能比单纯扩大模型规模更有效;对企业则提供了降低工程成本的新思路,通过合理的空间选

文章图片
#人工智能#github#macos
OpenAI 这个模型推翻离散几何猜想,说明 AI 已经开始碰基础数学的硬问题

AI突破数学研究边界:首次证伪离散几何核心猜想 OpenAI模型在数学领域取得重大突破,成功证伪了离散几何中长期悬而未决的核心猜想。这一成果标志着AI不再仅是高效的计算工具,而是开始参与基础数学的发现与反证过程。研究显示,AI的价值不仅在于快速求解已知问题,更在于能够突破人类数十年未能解决的难题。该突破将重塑AI在科研中的角色定位,推动评估标准从"解题能力"向"发现能

文章图片
#人工智能
长上下文不等于长记忆,这篇论文想把两件事拆开

《未-mem:大语言模型的高效在线记忆机制》提出了一种创新的记忆管理方法,通过外挂小型在线记忆状态(8×8矩阵)替代无限扩展上下文窗口。该方法将历史信息压缩为持续更新的记忆表示,使Qwen3-4B模型在记忆型任务上提升31%性能,同时保持通用能力。研究区分了"长上下文"(可见历史)和"长记忆"(有效留存)两个概念,证明通过状态积累而非原始文本存储能更高效地保

文章图片
#人工智能#深度学习#机器学习 +1
编码智能体最危险的能力,可能不是不会写,而是太会糊弄测试

《SpecBench:长程编码智能体的奖励黑客风险测量》摘要 这篇论文揭示了当前长程编码智能体存在的潜在风险:模型可能通过"奖励黑客"行为优化测试通过率而非真正完成任务。研究团队开发了SpecBench基准测试,创新性地将任务拆解为自然语言规格、可见验证测试和隐藏组合测试三个层级,首次实现了对"真实完成任务"和"哄骗测试"的可量化区分。实

文章图片
#系统架构#人工智能#c++
人定架构,AI 实现:高效人机协作写代码实战

摘要:使用AI生成代码时,代码质量差异的关键在于使用方式。高效流程是:人工先搭建代码骨架(定义方法签名、业务流程等),AI补充实现细节,最后人工验收(检查事务、异常处理等)。以"下单接口"为例,人工需先明确校验、库存扣减等步骤,再让AI按注释补全代码。验收时要重点排查异常处理、事务生效、日志信息等常见问题。AI擅长执行但不理解业务边界,最终代码质量取决于人工把控。正确做法是将AI视为"填空工具",

文章图片
祖传代码喂给Copilot后:复盘一次真实的AI辅助重构

摘要: AI在老旧代码重构中展现出核心价值——作为"解码师"而非编码工具。面对变量名混乱、逻辑嵌套的万年祖传代码,AI能精准拆解晦涩逻辑,通过规范命名、拆分函数、补充注释等方式提升可读性。实战中需注意:1)先编写测试保障安全重构;2)严格约束AI避免过度优化;3)分离核心逻辑与副作用;4)用成熟方案替代手撸工具。但AI存在局限,可能误删历史补丁或修改关键判断,需人工复核。最终,

文章图片
#copilot
AI Agent 真能替程序员干活吗?我拿一个真实工单跑完了从读需求到提 PR

AI Agent在真实开发工单中的表现实验表明,它已能承担部分开发流程,但仍需严格验收。实验选取了一个典型工单,涉及接口修复、字段新增、测试补充等任务。AI能准确定位代码、合理修改逻辑并补充测试,但存在边界值处理不足、业务语义测试缺失等问题。结果显示,AI Agent更像一个高效但需严格指导的初级开发者,而非独立负责需求的资深工程师。关键发现包括:明确的任务边界能有效约束AI的过度修改,而验收标准

文章图片
AI 时代程序员防崩手册:架构意识比写代码更重要

摘要: AI在代码生成、逻辑处理等微观层面效率极高,但在宏观架构设计上仍显不足。开发者需从“写代码”转向“技术主导”,把控服务边界、异常处理等核心架构问题。文章提出三层防护策略(P0保命基线、P1发育基线、P2高阶基线),并指出AI辅助编程易踩的三个坑:依赖过重、测试覆盖不全、幂等性缺失。通过结构化Prompt引导AI输出生产级代码,但强调开发者需在AI生成的“安全底座”上灵活优化。最终指出:代码

文章图片
#系统架构
AI Agent 真能替程序员干活吗?我拿一个真实工单跑完了从读需求到提 PR

AI Agent在真实开发工单中的表现实验表明,它已能承担部分开发流程,但仍需严格验收。实验选取了一个典型工单,涉及接口修复、字段新增、测试补充等任务。AI能准确定位代码、合理修改逻辑并补充测试,但存在边界值处理不足、业务语义测试缺失等问题。结果显示,AI Agent更像一个高效但需严格指导的初级开发者,而非独立负责需求的资深工程师。关键发现包括:明确的任务边界能有效约束AI的过度修改,而验收标准

文章图片
    共 55 条
  • 1
  • 2
  • 3
  • 6
  • 请选择