logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型量化实战指南:GPTQ/AWQ/INT4让70B模型跑在消费级显卡

大模型量化技术解析与实践指南 本文系统对比了当前主流的大模型量化技术方案,为工程落地提供关键决策依据。70B参数模型通过INT4量化可将显存需求从140GB降至40-55GB,使消费级硬件部署成为可能。 核心发现: AWQ方案在NVIDIA GPU环境下表现最优,推理速度比GPTQ快20-40%,精度损失更小(1-1.5%) GGUF格式是Apple Silicon设备首选,Q4_K_M量化在M系

文章图片
#mvc#开源#人工智能
2026年4月AI Agent开发安全全景:从Claude Code事件看企业防护实践

AI Agent安全防护体系摘要 2026年Q2数据显示,62%企业已部署AI Agent应用,但38%遭遇过安全事件(OWASP,2026)。本文针对AI Agent安全风险提出四大防护策略: 供应链安全 建立MCP Server白名单机制 实施代码来源、权限请求、依赖安全三维度审计 开发企业级MCP治理框架 提示注入防御 构建多层检测体系(输入验证/上下文监控/输出过滤) 识别直接注入、间接注

文章图片
#人工智能#安全#AIGC
Claude Code 51万行源码泄露:AI Agent开发安全警示录

2026年3月31日,Anthropic公司旗下AI编程工具Claude Code因npm打包配置失误,导致51.2万行未混淆TypeScript源码和1906个核心源文件泄露。泄露内容揭示了"赛博宠物"、"夜间做梦"等创新功能及完整Agent架构,暴露了AI企业安全流程缺陷。该事件成为行业安全警示,凸显快速迭代与安全规范间的矛盾。分析显示,技术根因在于so

文章图片
#人工智能#安全#copilot +1
Qwen3.5-Omni全模态大模型发布:215项SOTA、阿里定义“真全模态“标准

阿里巴巴发布Qwen3.5-Omni全模态大模型,在215项任务中实现SOTA表现,超越Gemini-3.1 Pro。该模型采用端到端原生全模态架构,支持文本、图片、音频、视频的统一理解与生成,实测可完整分析50分钟视频内容。技术突破包括统一token化、共享Transformer backbone和双模态输出能力。在MMMU、VideoQA等基准测试中表现优异,API已开放接入,适用于视频分析、

文章图片
#人工智能#AIGC#copilot
大模型量化实战指南:GPTQ/AWQ/INT4让70B模型跑在消费级显卡

大模型量化技术解析与实践指南 本文系统对比了当前主流的大模型量化技术方案,为工程落地提供关键决策依据。70B参数模型通过INT4量化可将显存需求从140GB降至40-55GB,使消费级硬件部署成为可能。 核心发现: AWQ方案在NVIDIA GPU环境下表现最优,推理速度比GPTQ快20-40%,精度损失更小(1-1.5%) GGUF格式是Apple Silicon设备首选,Q4_K_M量化在M系

文章图片
#mvc#开源#人工智能
2026年RAG技术演进:从向量检索到GraphRAG与Agentic RAG

摘要 RAG(检索增强生成)技术在2026年迎来重大演进。本文揭示传统RAG的三大瓶颈:向量相似度≠语义理解、分块切割破坏上下文、静态知识库不适应动态需求,并提出三大创新范式:GraphRAG通过知识图谱实现多跳推理,Agentic RAG将检索融入决策循环,Memory-Augmented AI建立长期记忆系统。文章包含完整工程代码,为开发者提供架构升级实践指南。 关键发现:RAG正从独立模块转

文章图片
#AIGC#copilot
2026Q1 AI季报:从模型竞争到系统竞争,Coding→Agent大主线全解析

2026年第一季度,全球大模型竞争格局发生了根本性变化:GPT-5 Ultra、Claude 4 Opus、Gemini 2.0 Ultra三强格局基本定型,但Benchmark战争已让位于"系统战争"——谁能把AI能力真正嵌入工作流、谁的Agent能独立完成复杂任务,才是新的竞争焦点。Operator 2.0开放自动化操作API,Llama 4打破开源边界,62%的企业已部署AI Agent。A

文章图片
#人工智能#AIGC#copilot
AI视频生成后Sora时代:Wan 2.6、Seedance与Kling重塑格局

2026年3月24日,OpenAI宣布正式关停Sora,25个月从封神到退场,官方给出的理由是"释放算力专注下一代模型"。这一事件彻底终结了西方AI公司在视频生成领域的统治地位,AI视频进入"中国时间"。阿里巴巴Wan 2.6、字节跳动Seedance、快手Kling成为新的三极格局,结合Vidu和Pika形成完整的竞争生态,开发者和内容创作者需要重新制定视频生成工具策略。

文章图片
#人工智能#音视频#AIGC +1
2026 AI编程工具Agent时代终极横评:Cursor vs Claude Code vs Windsurf vs Copilot

摘要 2026年AI编程工具迎来Agent时代,主流产品在功能与性能上呈现差异化竞争。Cursor凭借Supermaven引擎提供最优代码补全体验,支持8 Agent并行开发;Claude Code以80.8%的SWE-bench得分领跑Agent能力,适合终端开发者;Windsurf以$15/月提供高性价比方案,GitHub Copilot保持$10/月入门首选。本文通过7大维度对比分析四款工具

文章图片
#copilot#人工智能#语言模型 +1
Llama 4深度解析:Meta首个MoE开源多模态大模型,1000万Token上下文革命

摘要 2025年4月,Meta发布开源多模态大模型Llama 4系列,采用混合专家(MoE)架构,包含Scout和Maverick两款模型。Scout支持1000万Token超长上下文(约750万字),Maverick在科学推理基准GPQA Diamond以69.8分超越GPT-4o(53.6分)。两者均基于Early Fusion技术实现原生多模态理解,开源权重可商用,标志着开源模型进入MoE与

文章图片
#开源#人工智能#AIGC
    共 105 条
  • 1
  • 2
  • 3
  • 11
  • 请选择