logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型应用开发中的冒烟测试与正逆向测试

摘要: 测试是保障AI应用质量的关键环节。冒烟测试快速验证核心功能(如服务启动、基础API调用),确保版本基本可用;正向测试检查系统在正常输入下的预期表现(如生成符合要求的文本);逆向测试则针对异常场景(如对抗性输入、超长文本),评估模型的健壮性与安全性(如防越狱、错误处理)。三者结合可系统性发现AI应用的逻辑缺陷、安全漏洞及性能边界,降低部署风险。尤其在快速迭代的AI开发中,冒烟测试作为CI/C

#人工智能
LangGraph 1.0与之前版本对比分析与示例说明

LangGraph 1.0 是一次重大升级,主要变化包括:引入函数式API简化开发流程,支持装饰器直接转换Python函数为图;将Agent创建功能迁移至LangChain命名空间;强化类型化中断机制提升人机交互安全性;原生支持流式输出并放弃Python 3.9支持。建议开发者优先保留Graph API处理复杂逻辑,尝试函数式API简化简单流程,并更新Agent构建代码以适配新版本。

#人工智能
Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory

提出了Mem0,一个可扩展的以记忆为中心的架构,通过动态提取、合并和检索正在进行的对话中的重要信息来解决上述问题。进一步提出了Mem0g,一个增强的变体,利用基于图的记忆表示来捕捉对话元素之间的复杂关系结构。

#人工智能
智能体通信协议之A2A和ANP对比分析

A2A协议是企业级智能体协作标准,基于HTTP/JSON-RPC等技术实现智能体间的任务分配与状态同步,适合企业内部系统集成。其核心是通过Agent Card元数据实现能力发现,支持同步/异步通信和全生命周期任务管理,但缺乏共享知识库和复杂推理能力。与面向开放互联网的ANP协议相比,A2A在企业认证、集中式协作方面更具优势,而ANP侧重去中心化身份认证和跨平台协作。选择依据主要取决于应用场景(内部

#人工智能
大模型返回结果清洗与解析(一)——json解析

大模型返回的JSON字符串常因非标准格式导致解析失败(如包含```json标记或额外描述文本)。

#json#人工智能#python
nlp = spacy.load(“zh_core_web_sm“) 报错OSError: [E050] Can‘t find model ‘zh_core_web_sm‘,解决方法

该错误主要由模型未安装或版本冲突导致。安装,并确保环境与版本兼容性。确认模型与库的版本对应关系。

#自然语言处理
FlashAttention原理&概念快速入门2025251022

FlashAttention是一种IO感知的高效注意力机制实现,通过分块计算、算子融合和重算技术,将传统注意力O(N²)的内存访问压缩至线性复杂度。核心优势包括:显著降低显存占用5-20倍,提升计算速度2-4倍,尤其适合长序列(>4k)场景。安装只需匹配CUDA/PyTorch版本后pip安装,可通过全局开关或替换注意力层快速部署。版本演进从V1到V3持续优化,V3专为Hopper架构设计带

#人工智能#语言模型
千问qwen系列模型统计

通义千问(Qwen)系列模型自2023年起陆续发布,涵盖文本、视觉语言、全模态以及专用模型等多个类别。以下按发布时间由远及近对主要模型进行归纳,并附上参数规模、核心特性与技术要点。以上统计覆盖了截至 2025 年 11 月已发布的通义千问系列主要模型,包括文本、图像、多模态、视频等类型,并按发布时间线由远及近展开。所有信息均基于官方公告、技术报告与开源文档。以下图表展示了各系列模型的参数规模(单位

#语言模型#人工智能
    共 20 条
  • 1
  • 2
  • 请选择