
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
2026年6月初,AI行业爆出一则重磅人事变动:一位横跨特斯拉自研芯片、Google TPU、SpaceX星链硬件三大硬核技术栈的OpenAI芯片核心人物,正式宣布加入Anthropic。这位在AI芯片、自动驾驶、航天通信三个截然不同的硬件领域均有深度实战经验的老兵,被业界普遍视为Anthropic在自研算力路径上的关键补强。此举不仅标志着Anthropic在芯片自研战略上迈出重要一步,也折射出大
摘要:Speculative Decoding是一种无损的大模型推理加速技术,通过小模型预测候选token和大模型并行验证的协同机制,可实现1.5-2.2倍吞吐提升。该技术利用计算冗余实现"偷时间",核心在于验证机制保证输出分布与大模型完全一致。主流变体包括Classic SD、Medusa和Eagle等,vLLM已原生支持。实测显示Llama-70B搭配8B小模型可获得2倍加
AI编程评估迎来里程碑式突破:2026年5月,三大基准测试ProgramBench、Fullstack-Bench和ShapeCodeBench相继发布,标志着AI编程能力评估从"修bug"迈入"做项目"的新阶段。GPT-5.5在xhigh推理模式下首次实现从零重建cmatrix程序,打破ProgramBench零记录;GPT-5.4以43.49%的Pass
当地时间2026年6月11日,由亚马逊创始人杰夫·贝索斯(Jeff Bezos)与前Verily联合创始人维克·巴贾伊(Vik Bajaj)共同创立的AI初创公司Prometheus正式宣布完成120亿美元B轮融资,投后估值达到约410亿美元。这是Prometheus自2025年11月成立以来的第二轮融资——此前A轮融资规模为62亿美元——两轮融资合计已超过180亿美元。
2026年6月,AI编程领域迎来了一次意义深远的认知转变。Anthropic发布的Claude Fable 5模型,在开发者社区引发了截然不同的两极评价:日常编码场景下,许多开发者表示"aha moment并不明显",但在迁移、重构、遗留代码治理等长周期任务上,却展现出了与前代模型完全不在同一量级的能力差距。
2026年6月,AI编程领域迎来了一次意义深远的认知转变。Anthropic发布的Claude Fable 5模型,在开发者社区引发了截然不同的两极评价:日常编码场景下,许多开发者表示"aha moment并不明显",但在迁移、重构、遗留代码治理等长周期任务上,却展现出了与前代模型完全不在同一量级的能力差距。
2026年6月11日,Anthropic联合创始人兼CEO Dario Amodei在其个人博客darioamodei.com发布了一篇引发业界广泛关注的Policy长文——《Policy on the AI Exponential》(AI指数级增长政策论)。这是继去年Mythos/Fable争议之后,Anthropic管理层首次系统性地向外阐述其完整的AI治理框架与政策主张。
2026年6月9日,DeepSeek在其官网悄然挂出了一个重磅岗位——IDC(Internet Data Center)设计规划工程师。"参与从MW(兆瓦)到GW(吉瓦)级基础设施的规划与建设"。对于不太敏感的读者来说,这也许只是普通的技术招聘。但对于关注AI算力基础设施的从业者而言,这句话的分量不亚于一颗小型核弹。从MW到GW,意味着算力规模的跃升是一千倍;而GW级别的数据中心建设,在全球范围内
2026年6月9日,DeepSeek在其官网悄然挂出了一个重磅岗位——IDC(Internet Data Center)设计规划工程师。"参与从MW(兆瓦)到GW(吉瓦)级基础设施的规划与建设"。对于不太敏感的读者来说,这也许只是普通的技术招聘。但对于关注AI算力基础设施的从业者而言,这句话的分量不亚于一颗小型核弹。从MW到GW,意味着算力规模的跃升是一千倍;而GW级别的数据中心建设,在全球范围内
五分之四(80%)的企业承认,其生产环境中存在由AI生成代码引入的安全漏洞应用。这不是一家两家公司的个案,而是整个行业正在面临的系统性问题。更值得深思的是,这些漏洞并非"意外"或"不可预见"的产物。调研显示,开发者在代码审查阶段就已经察觉到LLM(大语言模型)生成的代码存在明显的安全问题——包括身份认证缺陷、依赖包漏洞、边界检查缺失等。然而,在交付压力的裹挟下,"先用AI把功能写出来跑通,再让安全







