logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Cursor + MCP:双剑合璧,解锁极致编程效率

近期,MCP在开发者社区中广受关注,成为业界热点。值得关注的是,Cursor编辑器在0.45.x版本中已正式加入了对MCP的支持。作为深度依赖Cursor的开发者们,理解MCP的核心概念及其应用场景,将有助于我们更高效地利用它来提升开发效率。环境说明开发环境:Node1.1.3MCP全称Model Context Protocol(模型上下文协议),这是官方的介绍:MCP 是一种开放协议,用于标准

文章图片
#microsoft#人工智能#网络
大语言模型推理优化技术综述(The Art of LLM Inference)

本文探讨了大语言模型(LLM)服务面临的主要挑战及优化方案。LLM推理包含预处理和解码两个阶段,存在稀疏性、内存带宽限制、低效调度等问题。针对这些挑战,文章提出了多项优化技术:1)KV缓存管理(PageAttention、Raddix树、压缩注意力);2)查询感知稀疏注意力(QUEST);3)推测解码;4)权重调度(Flexgen);5)系统级优化(FastServe)。此外还介绍了量化、注意力机

#语言模型#人工智能#自然语言处理
AI 智能体的技术架构与解决方案

相比于传统软件,AI 智能体是一个新兴事物,技术架构和解决方案仍处在高速迭代中。所以,本文章将重点放在理清 AI 智能体相关的技术脉络,而非具体技术实现。更多相关知识还需要读者通过第三方搜索等方式,保持与时俱进。【【2025版】这绝对是B站唯一将Coze(扣子)从入门到精通-基础/应用/搭建智能体讲明白的教程,存下吧,拿走不谢】

#人工智能#架构#microsoft
大语言模型推理优化技术综述(The Art of LLM Inference)

本文探讨了大语言模型(LLM)服务面临的主要挑战及优化方案。LLM推理包含预处理和解码两个阶段,存在稀疏性、内存带宽限制、低效调度等问题。针对这些挑战,文章提出了多项优化技术:1)KV缓存管理(PageAttention、Raddix树、压缩注意力);2)查询感知稀疏注意力(QUEST);3)推测解码;4)权重调度(Flexgen);5)系统级优化(FastServe)。此外还介绍了量化、注意力机

#语言模型#人工智能#自然语言处理
经典卷积神经网络——NiN

LeNet、AlexNet和VGG都有一个共同的设计模式:通过一系列的卷积层与汇聚层来提取空间结构特征;然后通过全连接层对特征的表征进行处理。AlexNet和VGG对LeNet的改进主要在于如何扩大和加深这两个模块。或者,可以想象在这个过程的早期使用全连接层。然而,如果使用了全连接层,可能会完全放弃表征的空间结构。网络中的网络NiN)提供了一个非常简单的解决方案:在每个像素的通道上分别使用多层感知

文章图片
#cnn#人工智能#神经网络
大模型中的嵌入向量

计算机无法直接对文本进行数学运算,需要先将文本(token)转为张量,然后才可以进行数学运算,这个将文本转为张量的过程,也就是词嵌入(Embedding)。当然,当计算机运算完成后,Embedding 又需要逆向转为具体的 token。前面文章和小伙伴们聊了 Tokenizer,经过 Tokenizer 之后,自然语言变为 Token,那么大模型就可以直接训练 Token 了嘛?还不行!

文章图片
#人工智能#机器学习
mysql之锁(全局&表&行)

根据加锁的范围,MYSQL里面的锁大致分为全局锁、表级锁、行锁。全局锁:对整个数据库实例加锁。表级锁:一种是表锁,一种是元数据锁(meta data lock,MDL)。

#mysql#数据库
拆箱开源版Coze:Agent核心三件套大公开,48小时揽下9K Star

扣子这是把Agent从开发、评测到运维的完整链路,全都打包开源了,堪称一步到位。搞Agent开发也有开源一条龙了!(Coze Studio)和才过了一个周末,两个项目就拿下了9K Star~再加上此前,扣子这是把Agent从开发、评测到运维的完整链路,全都打包开源了,堪称一步到位。有一说一,Agent在今年有多火大家都有目共睹。不论是各种爆款Agent的相继涌现,还是各大厂商陆续发布MCP协议支持

文章图片
#开源#人工智能
对标cursor,JetBrains官方推出Junie!

Junie 设计上能够理解每个项目的上下文,也能适应你的编程风格。它还能遵循特定的编码规范,让 Junie 更好地与你的工作方式保持一致。这不仅提升了代码质量,也让 Junie 在执行任务时更可靠,成为你团队中值得信赖的协作伙伴。

#人工智能#开发语言
Trae开发工具中配置Qwen3-235B-A22B

Cline是一款VSCode插件,支持集成阿里云百炼的通义千问或DeepSeek模型,用于智能编程。Qwen3-235B-A22B是通义实验室发布的旗舰级开源大模型,采用混合专家架构,总参数量达2350亿,激活参数为220亿。该模型支持双模式推理:思维模式适用于复杂任务,生成包含思考过程的中间步骤;非思维模式则针对简单问答,提升响应速度并降低算力消耗。此外,模型原生支持32,768个令牌的上下文长

#数据挖掘#人工智能#mllib +4
    共 580 条
  • 1
  • 2
  • 3
  • 58
  • 请选择