logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

OpenAI的o1模型与Transformer的无限潜力:数学证明推理算力无上限

近期,斯隆奖得主马腾宇和Google Brain推理团队创始人Denny Zhou合作,提出了一项引人注目的数学证明:只要思维链(CoT)足够长,Transformer就有能力解决各种复杂问题。这一发现引发了广泛关注,因为它为Transformer模型在推理算力方面的Scaling Law揭示了巨大的潜能

文章图片
#transformer#深度学习#人工智能 +1
【必藏】大模型分布式推理完全指南:vLLM单节点与多节点部署实战

本文详细介绍了vLLM大模型在三种分布式推理场景下的部署方法:单GPU、单节点多GPU张量并行以及多节点多GPU结合张量并行与流水线并行。文章提供了具体部署命令示例,包括单节点2/4 GPU配置和多节点环境下使用multiprocessing/Ray两种运行时的配置方法。通过实例演示了参数设置和节点配置,为开发者高效部署大模型推理服务提供了实用指导。最后还提供了AI大模型学习资源获取方式。

文章图片
#分布式#人工智能#产品经理 +1
【必藏】大模型分布式推理完全指南:vLLM单节点与多节点部署实战

本文详细介绍了vLLM大模型在三种分布式推理场景下的部署方法:单GPU、单节点多GPU张量并行以及多节点多GPU结合张量并行与流水线并行。文章提供了具体部署命令示例,包括单节点2/4 GPU配置和多节点环境下使用multiprocessing/Ray两种运行时的配置方法。通过实例演示了参数设置和节点配置,为开发者高效部署大模型推理服务提供了实用指导。最后还提供了AI大模型学习资源获取方式。

文章图片
#分布式#人工智能#产品经理 +1
华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

大模型,如今堪称AI界的「吞金巨兽」。从写诗到解题,从对话到编程,它们几乎无所不能,但动辄千亿甚至万亿参数的规模,让部署成本高得离谱。以FP16精度部署的DeepSeek-R1 671B为例,推理时大概需要1342GB的显存,如果是32GB 5090显卡,需要整整42张!为了降低成本,天才工程师们想出了后训练量化(Post-training Quantization,PTQ)的方法, 它能够在有限

文章图片
#人工智能
DeepSeek大模型一体机:本地私有化部署完全解析,建议收藏!!!

“DeepSeek大模型一体机行业深度:驱动因素、行业现状、产业链及相关公司深度梳理”。私有化部署凭借物理隔离、数据闭环、自主管控、定制服务等特征,正成为政企部署 AI 大模型的主流选择。DeepSeek 的技术创新显著降低了私有化部署的模型和算力门槛,有望解决政企落地 AI 应用的部分痛点难点问题,进一步推动政企私有化部署需求提升。

文章图片
#人工智能#DeepSeek
从零开始学大模型知识蒸馏:黑盒白盒技术详解,一篇全掌握!

这篇文章系统调研了大模型知识蒸馏技术,将其分为黑盒(仅访问教师模型的输入输出)和白盒(可访问中间状态)两类。介绍了代表性文献,包括综述研究和具体实现方法,如DeepSeek-R1的黑盒蒸馏和DistilQwen2.5的黑白盒结合方法。还讨论了蒸馏效果的量化评估方法,内容全面覆盖知识蒸馏的理论基础、技术分类、实践案例和评估方法,适合研究者和开发者学习参考。

文章图片
#人工智能#机器学习#深度学习 +3
【Deepseek】全网最全DeepSeek使用手册!学会了效率提高90%【建议收藏】

打不过就加入,英伟达官宣:DeepSeek R1现已正式上线英伟达NIM平台,成为英伟达人工智能企业软件平台的一部分。说什么不重要,重要的是行动够快。DeepSeek打破了英伟达的算力神话,引起整个AI圈的轰动。然后,今天就给大家介绍一下DeepSeek到底该如何使用,让大家更快的掌握DeekSeek使用方法。

文章图片
#人工智能#DeepSeek
AI大模型与Agent开发工程师:解锁年薪50万+的黄金职业,从入门到精通的全面指南!

本文详解AI大模型与Agent开发工程师职业前景,介绍大模型作为"大脑"、Agent作为"手脚"的协同关系,分析从传统AI到Agent系统的技术演进路径。详细列举开发工程师、算法专家和架构师等岗位分类及薪资范围(20K-75K),说明适合的专业背景,强调这是一个不看背景只看能力的领域,为想入行的人提供全面指导和发展方向。

文章图片
#人工智能#开发语言#java
2025年大模型时代就业宝典:精通核心技术,打造不可替代的职业发展蓝图!

随着大语言模型(Large Language Models, LLMs)的技术飞速迭代,人工智能领域正经历从通用对话工具向高度智能化、任务导向的智能体(Agent)系统的深刻转型。到2025年4月,企业对掌握LLM相关技术的专业人才需求持续高涨,核心能力聚焦于检索增强生成(RAG)、智能体任务自动化、模型对齐优化以及多模态融合。本文将全面剖析2025年大模型就业市场的技术演进路径、核心技能要求、行

文章图片
#人工智能#开发语言#算法 +1
重新定义「智能体」:从自主性到主动性,Manus创始人揭秘AI三大前沿与实战应用

鉴于Meta收购Manus的消息甚嚣尘上,我们发现Manus这家公司在被收购之前,对外作出了一场公开演讲,Manus AI联合创始人兼首席产品官张涛,在10月29日新加坡企业发展局主办的SWITCH大会上,分享了对于智能体的理解。

文章图片
#人工智能#开发语言#算法 +3
    共 1087 条
  • 1
  • 2
  • 3
  • 109
  • 请选择