logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-V3.2三大突破:DSA架构降本50%、RL算力超预训练10%、Agent合成数据

文章概要DeepSeek于2025年12月发布V3.2模型,在可扩展强化学习与智能体AI领域实现关键技术突破。

文章图片
#经验分享
AI浏览器对决:Comet与ChatGPT Atlas,谁才是你的效率神器?

2025年,Perplexity推出的Comet与OpenAI发布的ChatGPT Atlas两款AI原生浏览

文章图片
#经验分享
开源60万星画图神器draw.io:结合大模型,3分钟生成专业架构图

开源图表工具draw.io在GitHub上已获得超过60万星标,成为开发者绘制架构图的首选。

文章图片
#经验分享
2025年AI大事件盘点:从技术狂飙到残酷落地,谁在裸泳谁在扎根

未来的芯片设计,必须优先考虑如何高效运行这些经过极致优化的模型,而非一味追求纸面上的峰值算力。这彻底改变了半导体与AI产业的互动逻辑。如果说DeepSeek点燃了效率的火把,那么2025年中国开源模型的集体爆发,则彻底改写了全球AI技术的权力地图与生态规则。年初,开源世界的王座还属于Meta的Llama系列。但转折点发生在4月,阿里巴巴的。

文章图片
#人工智能
测试时学习(TTT):打破传统推理界限的动态学习革命

传统的机器学习模型就像个**“考试机器”测试时学习(TTT)动态学习范式**让模型在推理阶段依然保持"思考能力",通过实时调整隐藏状态来适应新数据。想象Transformer是个,预训练时背完整套书,测试时却只能照本宣科。而TTT模型则像,遇到新案件(测试数据)会主动调查线索(自监督学习)。TTT的三大举个栗子🌰:处理代码补全时,TTT-Linear会把当前代码上下文压缩到权重矩阵W中,这个矩阵

文章图片
#学习#人工智能
2025年最值得推荐的开源大模型智能体框架,你选对了吗?

2025年的智能体框架市场,既有老牌巨头的稳扎稳打,也有新锐黑马的异军突起。无论你是追求生态广度的LangChain,还是钟情于协作效率的AutoGen,亦或是偏爱低代码的Dify,总有一款框架能成为你的“最佳拍档”。选对框架,才能让AI智能体真正为你所用!

文章图片
#开源#人工智能
全方位了解TensorRT-LLM

减少90%显存访问,在H100上实现1.7倍加速分块并行策略:自动根据GPU架构选择最优分块,处理32k上下文无压力稀疏注意力:跳过不重要计算,长文本场景速度提升2x。

文章图片
#人工智能#机器学习
告别手动部署!GitHub Workflow与Action完全指南:从零构建自动化CI_CD流水线

当现有Action无法满足特定需求时,开发自定义Action是解决问题的最佳方案。

文章图片
#github#自动化#ci/cd
    共 87 条
  • 1
  • 2
  • 3
  • 9
  • 请选择