
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章摘要(148字): PagedAttention是vLLM框架的核心创新,通过借鉴操作系统分页机制,将KV Cache划分为固定大小的Block(默认16 tokens)进行管理。该技术解决了传统KV Cache内存利用率低(常<50%)的三大痛点:1)固定分配导致内部碎片;2)外部碎片造成内存浪费;3)无法共享相同前缀。采用逻辑-物理映射的BlockTable和全局内存池设计,实现2-4倍内

2026年6月末全球AI产业持续高速迭代:大模型侧旗舰产品分层竞争加剧,推理效率优化成为技术核心方向,开源与国产模型竞争力快速提升;智能体加速渗透编程、办公、创作等场景,同时token成本浪费、安全治理等问题逐步凸显;具身智能与机器人进入规模化落地初期,算力基建上游保持高景气,产业监管与伦理规范同步完善,AI向传统行业渗透的深度与效率成为长期增长关键。1.1 通用大模型(大语言模型与多模态模型)二
摘要:解决csv文件向mysql导入含有中文数据,导入后中文出现乱码问题。结论,在导入含中文字符时注意两个问题:第一,告诉Mysql文件的编码是什么?第二,数据库表中的列编码要设置成支持中文的字符集。导入源数据SQL代码
Python:https://wiki.woodpecker.org.cn/moin/PP3eDSklearn:http://sklearn.apachecn.org/cn/0.19.0/TensorFlow:http://www.tensorfly.cn/home/http://cwiki.apachecn.org/pages/viewpage.action?pageId...
2026年6月全球AI产业与相关领域动态密集,OpenAI发布GPT-5.6系列三款模型并推出自研推理芯片Jalapeño,Anthropic旗下模型推进落地同时伴随监管与技术争议,国产大模型、智能体、具身智能技术多点突破,硬件基建、投融资、宏观政策与社会影响维度同步呈现新变化,AI正从单一模型能力竞争向全栈产业生态竞争深度演进。模型分层与监管收紧并行:头部厂商加速构建从旗舰到性价比的全层级模型矩
DeepSpec项目总览:训练与评测推测解码draft模型的全栈框架 DeepSpec是由DeepSeek与北京大学联合开源的项目(2026年6月发布),基于MIT协议,包含DSpark、DFlash和Eagle3三种draft算法,支持Qwen/Gemma等目标模型。项目通过"数据准备→训练→评测"三阶段流程,训练后的draft模型可提升推理速度60%-85%。代码库采用模块化设计,核心包括数据
DeepSpec项目总览:训练与评测推测解码draft模型的全栈框架 DeepSpec是由DeepSeek与北京大学联合开源的项目(2026年6月发布),基于MIT协议,包含DSpark、DFlash和Eagle3三种draft算法,支持Qwen/Gemma等目标模型。项目通过"数据准备→训练→评测"三阶段流程,训练后的draft模型可提升推理速度60%-85%。代码库采用模块化设计,核心包括数据
核心趋势Agent原生成为主流:从工具到Agent的范式转移加速,OpenAI Workspace Agents、Claude Managed Agents记忆、Codex五大升级标志着Agent时代全面到来。模型能力快速收敛:六大商业模型在编码基准上压缩至1个百分点区间,但前沿实验室内部能力(如Anthropic Mythos Preview 93.9%)与公开模型差距拉大。端侧AI爆发:商汤S
本文介绍了verl框架中的DataProto数据协议与通信机制。DataProto作为统一的数据协议,将分布式强化学习训练中的异构数据(张量数据、非张量数据和元信息)封装为一个整体,解决了模块间数据交换的标准化问题。 核心特点包括: 三要素封装结构:通过TensorDict、非张量字典和元信息字典统一管理各类数据 双模式序列化:支持torch和numpy两种序列化方式以适应不同传输场景 异步处理机

同步开源自研LongCat-AudioDiT端到端语音克隆模型(1B/3.5B双版本,MIT协议),首创在波形潜空间直接进行扩散建模(Wav-VAE+扩散Transformer),抛弃梅尔谱中间表示,在Seed-ZH测试集说话人相似度达0.818(SOTA),刷新零样本音色克隆纪录,采用双重约束机制与自适应投影引导替代传统无分类器引导提升自然度。阿里巴巴:发布Wan2.7-Video视频生成与编辑







