logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

国产AI工具实战指南:通义千问与文心一言本地化应用

人工智能大模型正从云端走向终端,成为开发者与普通用户提升效率的核心工具。其底层原理基于Transformer架构与大规模参数微调,技术价值体现在低延迟响应、数据本地化处理与国产生态深度适配。在办公提效、教育辅助、内容创作及轻量级开发等场景中,通义千问、文心一言等合规可接入的国产AI平台已提供稳定API、桌面客户端与插件扩展能力。结合鸿蒙、澎湃OS等自主操作系统,更可实现隐私敏感任务的端侧运行。本文

3D高斯溅射与5-DoF主动视觉搜索:E3VS-Bench基准构建与算法实践

视觉搜索是计算机视觉与机器人领域的核心任务,旨在让智能体在未知3D环境中主动寻找目标。其技术原理通常涉及场景表示、感知决策与运动规划的结合。传统方法依赖神经辐射场(NeRF)等表示,虽渲染质量高,但难以满足实时交互需求。3D高斯溅射作为一种新兴的实时场景重建与渲染技术,通过将场景表示为可投影的3D高斯椭球,实现了高质量、低延迟的新视角合成,为动态交互任务提供了关键支撑。结合5自由度(5-DoF)的

能量正则化神经MPC:提升全向飞行机器人控制精度的关键技术

模型预测控制(MPC)是一种先进的控制框架,它通过在线求解优化问题来预测系统未来行为并生成最优控制指令。其核心原理在于利用系统动力学模型进行滚动优化,以实现精准跟踪和强鲁棒性。在机器人控制领域,MPC的技术价值尤为突出,能够处理多变量、带约束的复杂动态系统。然而,传统MPC的性能高度依赖模型的准确性,而现实中的未建模动态和扰动会严重影响控制效果。为此,神经MPC应运而生,它通过引入神经网络来学习名

基于SAM的地质图像多任务分割:Petro-SAM框架实践与优化

图像分割是计算机视觉的核心任务之一,旨在将图像划分为多个有意义的区域。其原理通常基于深度学习模型学习像素级特征表示,实现语义或实例级别的区分。在工程实践中,多任务学习(Multi-Task Learning)技术通过共享特征提取网络,让单一模型同时处理多个相关任务,显著提升了计算效率和任务间的一致性。这种技术价值在于能够统一模型架构,减少部署复杂度,并利用任务相关性相互促进以提升整体精度。在专业领

基于无监督学习的医疗手术紧急程度自动分类系统

自然语言处理技术在医疗领域的应用正逐渐改变传统医疗工作流程。通过预训练语言模型如BioClinicalBERT,可以有效地从非结构化医疗文本中提取语义信息。结合深度嵌入聚类(DEC)和BiLSTM网络,能够实现高精度的文本分类任务。这种技术方案特别适用于需要处理专业术语且对数据隐私要求严格的医疗场景。在手术紧急程度分类这一具体应用中,系统通过无监督学习实现了超过85%的准确率,显著提升了医疗资源分

AI全栈体验优化:幻灯片场景下的节流、Mock与状态机实战

在AI应用开发中,大模型响应延迟、API不稳定性与高调用成本常导致前端体验断层。理解节流机制如何抑制高频请求、Mock数据如何模拟真实行为并支撑并行开发,是构建可靠AI交互界面的基础能力。本文以幻灯片为载体,深入解析状态驱动的UI设计、带逻辑的动态Mock服务、以及覆盖UI/Service/Backend三层的节流防御体系,覆盖从用户感知建模、异步加载遮罩到生产级可观测性的完整链路,适用于AI笔记

因果注意力驱动的端到端OCR新范式:DeepEncoder V2解析

OCR(光学字符识别)作为计算机视觉与自然语言处理的交叉技术,其核心在于建模图像到文本的映射关系。传统方法依赖CTC或Seq2Seq架构,存在上下文割裂、版式适应差和推理延迟高等固有瓶颈。因果注意力机制通过在编码器中引入时序约束,使模型具备‘边看边写’的条件生成能力,显著提升对手写连笔、古籍竖排、印章遮挡等复杂场景的鲁棒性。该技术不仅重构了OCR的建模范式,更推动其从图像处理任务向视觉语言联合理解

Harness Engineering与Meta-Harness:MCP协议驱动的AI工程化范式

Harness Engineering 是一种将大模型能力封装为可编排、可发现、可协同的工程组件的方法论,其核心依托于 MCP(Model Control Protocol)协议与 Meta-Harness 元规范。MCP 定义了标准化的能力注册、初始化、执行与健康检查接口,使不同模型服务(如 Claude、Ollama、Stable Diffusion)能统一接入;Meta-Harness 则抽

Mistral-7B+LoRA微调实战:显存优化与工程落地指南

LoRA(低秩适应)是一种高效的大语言模型参数高效微调技术,通过在原始权重旁注入低秩矩阵实现轻量适配,显著降低显存占用与训练成本。其核心原理在于保持主干模型冻结,仅更新少量可训练参数,兼顾效果稳定性与部署可行性。在资源受限场景下,LoRA成为7B级模型如Mistral-7B落地的关键路径——该模型凭借滑动窗口注意力支持32K长上下文,而结合LoRA后显存可压至8.7GB以内,adapter体积仅2

#LoRA
深度学习图像去雾:物理建模与数据驱动的协同工程

图像去雾本质上是求解大气散射方程的逆问题,涉及场景辐射度、透射率与大气光等物理量的联合估计。其技术价值在于突破传统图像增强局限,为自动驾驶、交通监控、遥感解析等真实视觉系统提供语义一致的清晰输入。随着雾霾类型异构性(如咸湿雾、沙尘雾)和边缘部署约束日益凸显,单纯依赖端到端深度学习已显乏力;当前主流方案正转向物理先验嵌入网络结构、可微分物理损失约束、以及能见度感知的轻量化建模。本文聚焦深度学习去雾中

    共 137 条
  • 1
  • 2
  • 3
  • 14
  • 请选择