佳琪小仙女个人主页

@weixin_30033489

佳琪小仙女

2023-09-05 11:22:23 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

LangGraph工程实践：解决LLM工作流的任务粒度、节点契约与执行追踪难题

在大语言模型应用开发中，'工作流编排'已成为超越单纯API调用的核心能力。其本质是构建具备状态管理、条件分支、重试机制和可审计路径的分布式系统。LangGraph通过StateGraph抽象，将任务（Task）切分为原子节点、强制定义节点（Node）输入输出契约、并提供原生执行轨迹（Trace）支持，显著提升LLM应用的可观测性、可维护性与生产稳定性。本文聚焦TNT-LLM范式——即任务粒度可控、

Credo框架：LLM管道的动态控制与优化实践

在大型语言模型(LLM)应用开发中，管道控制是决定系统性能与成本效率的关键技术。传统静态管道采用固定处理逻辑，难以适应不同复杂度查询的需求。Credo框架创新性地引入声明式控制机制，通过运行时语义状态监测（信念系统）和策略驱动的动态调整，实现LLM管道的智能优化。该技术特别适用于金融QA等需要精准资源分配的场景，能够根据查询复杂度自动选择轻量级模型或升级至大模型，结合BM25与稠密检索等技术实现最

医疗AI幻觉检测：构建SOAP笔记临床推理评估新范式

大语言模型在专业领域应用时常面临“幻觉”问题，即生成看似合理但缺乏事实依据的内容。在医疗场景中，这一问题尤为关键，因为AI生成的临床记录如SOAP笔记需要极高的准确性和可靠性。其核心原理在于，模型可能基于训练数据的表面模式而非真实医学逻辑进行推断，导致生成内容与输入信息脱节。为应对这一挑战，需要建立一套新的评估体系，从信息忠实度、逻辑一致性、医学合理性等维度，结合规则引擎、判别模型和外部知识库进行

终身分层主题建模COBWEBTM：从静态LDA到动态知识树的演进

主题建模是自然语言处理与文本挖掘中的基础技术，旨在从文档集合中自动发现隐藏的语义主题。传统方法如LDA（Latent Dirichlet Allocation）采用批处理模式，为固定数据集生成一组扁平化的主题，属于“一次性建模”。然而，现实世界的数据往往是持续产生的流式数据，这要求模型具备**终身学习**能力，能够增量地吸收新信息并演化已有知识结构。COBWEBTM正是为解决这一挑战而设计，其核心

DETR-ViP：基于视觉提示与选择性融合的开放词汇目标检测

目标检测是计算机视觉的核心任务，旨在定位并识别图像中的物体。传统方法依赖预定义类别，难以应对现实世界中不断涌现的新物体。开放词汇目标检测（OVOD）通过引入文本和视觉多模态信息，使模型能够识别训练时未见过的类别。其技术原理在于利用预训练视觉-语言模型（如CLIP）的语义对齐能力，将文本描述与视觉特征关联，实现零样本或小样本泛化。这一技术价值显著，它降低了数据收集和标注成本，提升了模型在动态环境中的

基于深度学习的COVID-19胸部CT影像辅助诊断系统：从模型构建到部署实践

卷积神经网络（CNN）作为深度学习在计算机视觉领域的核心技术，通过卷积层、池化层等结构自动提取图像的多层次特征，其原理在于模拟生物视觉系统的局部感知和参数共享机制。这一技术价值在于能够处理高维、复杂的图像数据，在减少人工特征工程的同时提升识别精度与效率。在工程实践中，CNN及其变体（如ResNet、DenseNet）广泛应用于图像分类、目标检测等场景。特别是在医学影像分析领域，结合迁移学习与注意力

#深度学习

梯度消失问题本质与四大实战解决方案

梯度消失是深度神经网络训练中常见的优化障碍，源于反向传播时链式法则导致的梯度指数衰减，尤其在使用sigmoid、tanh等饱和激活函数时尤为显著。其数学本质是各层导数与权重连乘的累积效应，使浅层参数难以获得有效更新信号。该问题直接影响模型收敛速度、泛化能力及部署稳定性，广泛存在于CNN、RNN、Transformer乃至变分推断等架构中。解决路径需协同激活函数升级（如ReLU、Swish）、科学权

AI大模型与精神本源论的底层架构对照：从意义发生到真理确权

在人工智能工程实践中，‘理解’‘主体性’‘真理’等概念长期缺乏可计算定义。本文立足Transformer架构的嵌入层、注意力机制、残差连接、位置编码与损失函数等真实计算组件，系统解析意识理论中‘意义发生’与‘认知闭环’等基础命题如何映射为张量操作约束——例如语境敏感的非线性嵌入调制、可追踪的知识确权通路、具备反馈能力的动态状态变量。这种结构同构性验证，跳出了哲学隐喻与行为类比，直指模型内部是否满足

Hy3preview实测：国产大模型工程化新刻度

大模型工程化能力正从参数竞赛转向确定性交付，核心在于低延迟、高吞吐、强稳定性与场景适配性。其技术原理涵盖混合精度调度、动态KV缓存压缩、语义感知Tokenizer等关键优化，显著提升长上下文推理效率与关键信息召回率。该能力直接支撑金融风控、政务热线、法律合同分析等对响应抖动敏感的企业级场景，推动MaaS（模型即服务）从概念走向SLA可承诺的生产实践。Hy3preview作为典型代表，以16K上下文

小米MiLM-1.0与HyperMind端侧大模型技术解析

大语言模型（LLM）在终端设备的轻量化部署，是当前AI工程落地的关键挑战。其核心原理涉及模型压缩、知识蒸馏、MoE稀疏激活与端侧推理引擎优化；技术价值在于降低云端依赖、保障数据隐私并提升响应实时性。典型应用场景包括手机本地知识问答、语音助手离线理解、影像多模态摘要等。小米已公开发布MiLM-1.0（10B稠密架构，支持中文长文本与多模态理解）及Xiaomi HyperMind（澎湃OS 2.0内置

共 143 条

请选择