logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

输电走廊点云语义分割实战:全局-局部融合框架与TowerDataset应用

点云语义分割是三维视觉中的核心技术,旨在为三维空间中的每个点赋予精确的语义标签,其核心原理是通过深度学习模型学习点云的几何与上下文特征。该技术具有极高的工程价值,是实现环境智能感知与自动化分析的关键。在电力巡检、自动驾驶、智慧城市等应用场景中,它能从海量、无序的激光雷达数据中自动识别并分类目标物体。针对输电走廊巡检这一特定领域,其挑战在于目标尺度差异大、类别极度不平衡。本文深入探讨了如何利用全局-

LogTokU:蛋白质设计中基于Logits的Token级不确定性估计原理与应用

在深度学习和蛋白质工程领域,不确定性估计是评估模型预测可靠性的关键技术,它帮助区分模型的认知不确定性与数据噪声。其核心原理在于分析模型输出层的逻辑值分布,通过量化概率分布的平坦度来度量置信度,常用方法包括计算信息熵。这项技术的价值在于能够为序列生成任务提供细粒度的可信度评分,尤其在实验成本高昂的蛋白质设计中,能有效识别高风险残基,指导局部优化和优先级排序。应用场景广泛嵌入于自回归或掩码语言模型的设

轻量模型与大模型混合调用实战指南:Haiku 4.5 vs GPT-5.2

大语言模型(LLM)推理并非单纯比拼参数规模或基准分数,而是围绕实际业务场景展开的算力效率博弈。轻量模型如Haiku 4.5通过Layer-Gated Sparse Inference(LGSi)机制实现低延迟、高吞吐与低成本,适用于模板化生成、客服响应等对实时性敏感的场景;而GPT-5.2凭借Fixed-Depth Attention Scheduling(FDAS)保障强确定性与跨领域鲁棒性,

基于两阶段扩散模型的合成人类活动轨迹生成框架SynHAT详解

扩散模型作为生成式人工智能的核心技术之一,通过模拟数据在噪声空间中的扩散与逆扩散过程,能够学习复杂的数据分布并生成高质量的新样本。其原理在于逐步向数据添加噪声,再训练神经网络学习逆向的去噪过程,从而从随机噪声中重建出结构化的数据。这一技术在图像、音频合成领域已展现出巨大价值,其可控生成和高质量输出的特性,为解决数据稀缺与隐私保护问题提供了新思路。在时空数据科学和城市计算领域,人类活动轨迹数据是进行

MS-SSE-Net:多尺度注意力网络在结构健康监测中的实战应用

深度学习通过卷积神经网络(CNN)等模型,能够从复杂数据中自动学习特征,实现智能化的模式识别与分类。其核心原理在于通过多层非线性变换提取数据的层次化特征表示。在工程实践中,这种能力对于处理高维、噪声干扰大的传感器数据具有重要价值,尤其在需要精准状态判断的工业场景中。结构健康监测(SHM)正是这样一个典型领域,它需要对振动、声发射等信号进行损伤识别。然而,传统CNN模型在处理此类信号时,常因特征的多

#深度学习
基于CVAE与潜在扩散模型的月尺度气候模拟器:原理、实现与应用

气候预测是气象科学和地球系统建模的核心领域,旨在通过数学模型和数据分析预估未来气候状态。其原理在于理解大气、海洋、陆地等圈层间的复杂相互作用及能量平衡过程。随着人工智能技术的发展,深度学习为传统数值预报提供了新的范式,通过数据驱动的方式学习气候系统的统计规律与演变模式,显著提升了模拟效率并降低了计算成本。在工程实践中,生成式模型如变分自编码器和扩散模型,能够高效处理高维时空数据,生成物理合理且多样

FlashAttention-2原理与工程实践:Transformer推理显存优化核心技术

Self-Attention是Transformer模型的核心计算模块,其O(N²)复杂度在长序列场景下极易引发显存带宽瓶颈与OOM问题。传统实现因重复访存、中间矩阵驻留和全局softmax导致GPU利用率低下;FlashAttention-2通过分块计算、SRAM内融合运算与数值等价的在线softmax重构,在不牺牲精度前提下将显存占用从O(N²)降至O(N),显著提升A100/H100等现代G

CNN中padding的本质:不只是补零,而是空间延拓与信息保真

卷积神经网络中的padding本质上是输入信号在空间域的数学延拓操作,用于解决标准卷积导致的尺寸坍缩与边缘信息丢失问题。其原理源于信号处理中的奇延拓(zero-padding)、偶延拓(reflect-padding)和常数延拓(replicate-padding),分别对应不同边界连续性假设。技术价值在于保障平移等变性、维持有效感受野、提升梯度均衡性,并直接影响模型对边缘目标(如行人、路标、焊点

LangChain企业级RAG系统实战:从踩坑到生产落地

RAG(检索增强生成)是当前构建可信AI问答系统的核心范式,其本质是将外部知识库与大语言模型能力解耦协同。原理上依赖文档分块、向量嵌入、混合检索与受控生成四大环节,技术价值在于规避幻觉、保障溯源、提升业务准确率。典型应用场景包括合同条款比对、故障代码溯源、合规政策检索等强审计需求领域。然而真实落地中,LangChain默认流程在语义断裂、元数据失焦、LLM不可控三方面存在显著缺陷。本文基于20万份

#RAG
腾讯混元MT1.5:1GB内存实现端侧离线翻译的工程实践

端侧翻译模型是边缘AI落地的关键技术之一,其核心在于平衡精度、延迟、内存与功耗。基于Encoder-Decoder架构的轻量级NMT模型,通过动态层数裁剪、混合子词分词与量化内存管理,可在1GB运行内存约束下实现毫秒级响应和高鲁棒性翻译。该技术显著降低对云端依赖,提升隐私安全性与弱网适应性,广泛适用于移动App集成、嵌入式多语种硬件及政企离线场景。腾讯混元MT1.5作为开源代表,不仅验证了终端设备

    共 127 条
  • 1
  • 2
  • 3
  • 13
  • 请选择