logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LangGraph工程实践:解决LLM工作流的任务粒度、节点契约与执行追踪难题

在大语言模型应用开发中,'工作流编排'已成为超越单纯API调用的核心能力。其本质是构建具备状态管理、条件分支、重试机制和可审计路径的分布式系统。LangGraph通过StateGraph抽象,将任务(Task)切分为原子节点、强制定义节点(Node)输入输出契约、并提供原生执行轨迹(Trace)支持,显著提升LLM应用的可观测性、可维护性与生产稳定性。本文聚焦TNT-LLM范式——即任务粒度可控、

Credo框架:LLM管道的动态控制与优化实践

在大型语言模型(LLM)应用开发中,管道控制是决定系统性能与成本效率的关键技术。传统静态管道采用固定处理逻辑,难以适应不同复杂度查询的需求。Credo框架创新性地引入声明式控制机制,通过运行时语义状态监测(信念系统)和策略驱动的动态调整,实现LLM管道的智能优化。该技术特别适用于金融QA等需要精准资源分配的场景,能够根据查询复杂度自动选择轻量级模型或升级至大模型,结合BM25与稠密检索等技术实现最

医疗AI幻觉检测:构建SOAP笔记临床推理评估新范式

大语言模型在专业领域应用时常面临“幻觉”问题,即生成看似合理但缺乏事实依据的内容。在医疗场景中,这一问题尤为关键,因为AI生成的临床记录如SOAP笔记需要极高的准确性和可靠性。其核心原理在于,模型可能基于训练数据的表面模式而非真实医学逻辑进行推断,导致生成内容与输入信息脱节。为应对这一挑战,需要建立一套新的评估体系,从信息忠实度、逻辑一致性、医学合理性等维度,结合规则引擎、判别模型和外部知识库进行

终身分层主题建模COBWEBTM:从静态LDA到动态知识树的演进

主题建模是自然语言处理与文本挖掘中的基础技术,旨在从文档集合中自动发现隐藏的语义主题。传统方法如LDA(Latent Dirichlet Allocation)采用批处理模式,为固定数据集生成一组扁平化的主题,属于“一次性建模”。然而,现实世界的数据往往是持续产生的流式数据,这要求模型具备**终身学习**能力,能够增量地吸收新信息并演化已有知识结构。COBWEBTM正是为解决这一挑战而设计,其核心

DETR-ViP:基于视觉提示与选择性融合的开放词汇目标检测

目标检测是计算机视觉的核心任务,旨在定位并识别图像中的物体。传统方法依赖预定义类别,难以应对现实世界中不断涌现的新物体。开放词汇目标检测(OVOD)通过引入文本和视觉多模态信息,使模型能够识别训练时未见过的类别。其技术原理在于利用预训练视觉-语言模型(如CLIP)的语义对齐能力,将文本描述与视觉特征关联,实现零样本或小样本泛化。这一技术价值显著,它降低了数据收集和标注成本,提升了模型在动态环境中的

基于深度学习的COVID-19胸部CT影像辅助诊断系统:从模型构建到部署实践

卷积神经网络(CNN)作为深度学习在计算机视觉领域的核心技术,通过卷积层、池化层等结构自动提取图像的多层次特征,其原理在于模拟生物视觉系统的局部感知和参数共享机制。这一技术价值在于能够处理高维、复杂的图像数据,在减少人工特征工程的同时提升识别精度与效率。在工程实践中,CNN及其变体(如ResNet、DenseNet)广泛应用于图像分类、目标检测等场景。特别是在医学影像分析领域,结合迁移学习与注意力

#深度学习
梯度消失问题本质与四大实战解决方案

梯度消失是深度神经网络训练中常见的优化障碍,源于反向传播时链式法则导致的梯度指数衰减,尤其在使用sigmoid、tanh等饱和激活函数时尤为显著。其数学本质是各层导数与权重连乘的累积效应,使浅层参数难以获得有效更新信号。该问题直接影响模型收敛速度、泛化能力及部署稳定性,广泛存在于CNN、RNN、Transformer乃至变分推断等架构中。解决路径需协同激活函数升级(如ReLU、Swish)、科学权

AI大模型与精神本源论的底层架构对照:从意义发生到真理确权

在人工智能工程实践中,‘理解’‘主体性’‘真理’等概念长期缺乏可计算定义。本文立足Transformer架构的嵌入层、注意力机制、残差连接、位置编码与损失函数等真实计算组件,系统解析意识理论中‘意义发生’与‘认知闭环’等基础命题如何映射为张量操作约束——例如语境敏感的非线性嵌入调制、可追踪的知识确权通路、具备反馈能力的动态状态变量。这种结构同构性验证,跳出了哲学隐喻与行为类比,直指模型内部是否满足

Hy3preview实测:国产大模型工程化新刻度

大模型工程化能力正从参数竞赛转向确定性交付,核心在于低延迟、高吞吐、强稳定性与场景适配性。其技术原理涵盖混合精度调度、动态KV缓存压缩、语义感知Tokenizer等关键优化,显著提升长上下文推理效率与关键信息召回率。该能力直接支撑金融风控、政务热线、法律合同分析等对响应抖动敏感的企业级场景,推动MaaS(模型即服务)从概念走向SLA可承诺的生产实践。Hy3preview作为典型代表,以16K上下文

小米MiLM-1.0与HyperMind端侧大模型技术解析

大语言模型(LLM)在终端设备的轻量化部署,是当前AI工程落地的关键挑战。其核心原理涉及模型压缩、知识蒸馏、MoE稀疏激活与端侧推理引擎优化;技术价值在于降低云端依赖、保障数据隐私并提升响应实时性。典型应用场景包括手机本地知识问答、语音助手离线理解、影像多模态摘要等。小米已公开发布MiLM-1.0(10B稠密架构,支持中文长文本与多模态理解)及Xiaomi HyperMind(澎湃OS 2.0内置

    共 143 条
  • 1
  • 2
  • 3
  • 15
  • 请选择