
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
你的副业项目再也无法拯救你
AI工具正在颠覆技术招聘:作品集从"工作证明"沦为"提示词证明"。随着Bolt.new等平台能一键生成完整应用,传统项目展示的价值急剧下降——过去需要4-8周开发的成果,现在60秒即可完成。这导致40%招聘官难以辨别真实能力,应届生就业率下降20%。新信号体系正在形成:开源贡献、用户留存率、代码审查能力成为关键指标。GitHub研究显示,顶尖开发者正转型为&

大模型推理的技术总结
本文探讨了大型语言模型(LLM)推理中的批处理(batching)技术,分析了推理过程的两阶段特征:Prefill(计算密集型)和Decode(内存带宽受限)。介绍了计算量评估方法(FLOPs)和模型浮点运算利用率(MFU)的概念,对比了四种批处理类型:无批处理、静态批处理、动态批处理和连续批处理。其中连续批处理(token-by-token处理)最适合LLM推理,能有效提高GPU资源利用率。文章

天空计算领域的开源项目SkyPilot介绍
《天空计算:多云互操作性的未来探索》天空计算(Sky Computing)由UC Berkeley的Ion Stoica教授提出,旨在构建云平台之上的互操作层,打破云厂商间的壁垒。经历云计算从技术竞争到运营能力比拼的十年演进,天空计算技术逐渐从概念走向实践。其核心是通过跨云代理抽象异构云资源,使用户摆脱供应商锁定(Vendor Lock-in),尤其契合AI时代对算力调度和成本优化的需求

到底了








