logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

OCR 模型深度对比分析报告 - AI分析

本报告对比分析了2026年开源OCR领域三大前沿模型:GLM-OCR、DeepSeek-OCR-2和PaddleOCR-VL-1.5。三款模型在OmniDocBenchv1.5基准测试中表现优异,GLM-OCR以94.62%准确率领先,PaddleOCR-VL-1.5以94.50%紧随其后,DeepSeek-OCR-2获91.09%。模型设计各有侧重:GLM-OCR注重轻量高效(0.9B参数),P

文章图片
#人工智能
Gemma-4-31B-it 在 DGX Spark 上的性能测试结果

对于交互式和 Agentic 工作负载,26B-A4B MoE 是 DGX Spark 上的明确赢家:最快解码速度(23.7 t/s)、长上下文下最佳 Prompt 处理速度(pp2048 达 3105 t/s)、首次响应时间也具有竞争力。LPDDR5X 统一内存架构在限制 dense 模型的同时,反而有利于 MoE 设计——每个 Token 只需流式读取 4B 激活参数。⚠️注意。

#人工智能
在DGX-Spark上多模态模型gemma-4-31B-it vLLM部署

显存优化fp8量化 + 70% 显存限制 + 分块预填充,适合大模型部署性能优化:前缀缓存 + SafeTensors 格式,提升重复查询和加载速度功能特性:支持工具调用(Tool Calling)和思维链解析,适配 Gemma 4 原生能力长上下文:26万 token 支持,适合长文档处理。

Claude Code 深度技术研究报告 - AI 分析分享

2026年3月31日,Anthropic 发布 @anthropic-ai/claude-code v2.1.88 时,意外将 59.8MB 的 JavaScript Source Map 文件(cli.js.map)包含在 npm 包中,导致约 512,000 行 TypeScript 源代码完全公开。行动前必须将内存与实际代码核对,减少幻觉。这是 Anthropic 的第二次源码泄漏:仅5天前

#人工智能#开源
BPMN.io全方位深度分析报告架构解析 - AI分析分享

Camunda(bpmn.io 母公司)在 OMG 标准委员会深度参与 BPMN/DMN/FEEL 标准的修订,Falko Menge 担任 DMN/FEEL 标准委员会主席,Nico Rehwaldt 参与 FEEL 表达式语言 TCK(技术兼容套件)开发。核心定位:BPMN.io 不是一款独立的 SaaS 产品,而是一个「工具包生态」——它提供的是构建流程建模应用的砖石与脚手架,Camunda

#架构#人工智能#开源
国内外AI Agent产业全景分析报告 - (AI分析)

维度国外(美国)国内(中国)基础模型OpenAI、Google、Anthropic领先DeepSeek逆袭,通义、豆包、文心并进云基础设施AWS、Azure、GCP完善阿里云、腾讯云、火山引擎快速进步企业应用Microsoft垄断,Salesforce、Oracle补充多企业平行发展,缺乏统一标准垂直应用国防、科研、金融领先金融、通信、制造快速追赶开源生态成熟完善快速发展中芯片自给英伟达垄断,Go

#人工智能
LiteLLM 深度全面分析-AI分析分享

LiteLLM 是由 BerriAI 开发的开源项目(MIT 协议,GitHub 已超过 28,000 星),核心使命是通过统一的 OpenAI 格式接口,接入 100+ 家 LLM 提供商,让开发者无需面对各厂商 API 的差异性,同时提供完整的企业级管控能力。用一句话概括:LiteLLM = 统一 LLM 入口 + 智能路由 + 成本治理 + 可观测性。生产用例包括 Netflix、Lemon

#人工智能
Clawith 大模型设计逻辑与前端接口架构分析 -AI分析

Clawith 是 DataElem 基于其企业 AI 平台BISHENG积累的工程经验,专门为 OpenClaw 多智能体场景重新设计的团队协作平台。理解其架构必须从"不在本地运行任何 AI 模型"这一核心设计决策出发——所有 LLM 推理均代理至外部 API 提供商(OpenAI / Anthropic / DeepSeek / Azure 等),本地部署的是一套标准的 Web 应用 + Do

#前端#架构#人工智能
    共 44 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择