logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

TANGO是一个开源的分布控制系统

TANGO是一个开源的分布式控制系统,它基于CORBA构建,所以跨平台,目前已经在window ,linux,solaris上实现,它的核心是把每个采集控制的设备看做一个device server,通过上层封装给客户端提供简易的接口,更详细内容请期待我即将翻译完的TANGO用户手册转载于:https://www.cnblogs.com/zhangyang/archive/2007/08/29...

Transformer位置编码技术演进与自适应优化方案

位置编码是Transformer架构处理序列数据的关键技术,其核心作用是为模型注入序列顺序信息。从早期的绝对位置编码到相对位置编码(Relative Position Embedding)和旋转位置编码(RoPE),技术演进始终围绕如何更好地建模长程依赖关系。这些方法通过不同的数学变换实现位置感知,但在处理超长序列时仍面临注意力分散、梯度消失等挑战。自适应位置编码(APE)创新性地引入熵感知旋转机

基于OpenClaw与WisGate API构建个人第二大脑:语义搜索与知识管理实践

在信息爆炸的时代,高效的知识管理成为开发者和研究者的核心需求。语义搜索技术通过将文本转化为高维向量,实现了基于含义而非关键词的智能检索,其原理是利用嵌入模型捕捉文本的深层语义关系。这项技术的核心价值在于构建可理解用户意图的外部知识系统,显著提升信息查找和利用效率。在工程实践中,结合开源AI记忆代理与强大的模型API,可以搭建私有化部署的个人知识库。本文以OpenClaw和WisGate API为例

供应链攻击深度解析:从Python依赖漏洞到AI应用安全防御

软件供应链安全是当今开发领域的关键议题,它涉及从代码编写到部署运行的整个生命周期。其核心原理在于,现代应用高度依赖开源生态,任何第三方组件的安全漏洞都可能成为攻击入口。这种攻击方式的技术价值在于,它能绕过传统边界防御,直接渗透到应用内部。在AI应用开发场景中,由于大量使用开源模型集成工具,供应链风险尤为突出。例如,近期发生的针对LiteLLM等AI网关组件的攻击事件,就利用了Python包管理机制

CTCLoss的‘潜规则’与实战避坑指南:为什么你的语音识别模型不收敛?

本文深入探讨了CTCLoss在语音识别模型中的三大隐形成本与调优策略,包括输入输出长度关系、条件独立假设和单调对齐约束的实战影响。通过具体案例和代码示例,提供了针对中文语音识别、混合损失函数和多说话人场景的优化方案,帮助开发者解决模型不收敛问题并提升训练效率。

#语音识别
NVIDIA GTC 2023深度解析:生成式AI全栈基础设施与工程实践指南

在人工智能领域,计算基础设施正经历从以计算为中心到以数据为中心的范式转变。其核心原理在于,随着大模型参数量的爆炸式增长,训练和推理的瓶颈已从浮点运算能力转向内存带宽与互联带宽。这一转变的技术价值在于,它能显著降低海量数据搬运带来的能耗与时间开销,是支撑大模型经济可行性的物理基础。其应用场景广泛覆盖了云端大规模训练、边缘低延迟推理以及终端设备感知。以NVIDIA GTC 2023发布的全栈解决方案为

#生成式AI
印度教师与微软共创AI教育工具:以用户为中心的设计实践

在教育科技领域,以用户为中心的设计(UCD)理念正成为AI应用开发的关键方法论。其核心原理是通过深度理解一线用户的真实需求,将技术方案与具体场景紧密结合,从而提升产品的可用性和有效性。这种设计模式的技术价值在于能够构建出真正解决实际问题的工具,避免技术驱动的产品脱离实际。在教育场景中,AI工具需要理解教学准确性、认知适龄性、互动性等多维度质量标准,这通常通过“人在回路”的机器学习模式实现,让教师反

LazyGraphRAG:基于图结构与懒惰策略的高效RAG系统设计与实践

检索增强生成(RAG)是大模型应用落地的关键技术,它通过检索外部知识库来增强生成内容的准确性与可靠性。其核心原理是将用户查询与向量化文档片段进行匹配,并将相关上下文输入大模型以生成答案。这项技术的价值在于有效缓解了大模型的幻觉问题,并提升了专业领域问答的准确性。然而,传统RAG方案常面临检索噪声大、处理长文档能力有限以及API调用成本高昂等挑战。在实际应用场景中,如企业知识库助手、智能客服和文档分

#RAG
DeepSeek双模式推理:快速模式与专家模式技术解析

大模型推理架构正从单一模式走向场景化分治,核心在于平衡计算效率、响应延迟与任务复杂度。动态剪枝、混合专家(MoE)路由、KV Cache优化等关键技术,使模型能在不同负载下自适应分配算力。其中,快速模式聚焦轻量级实时交互与批量处理,通过上下文感知重要性评分与选择性缓存降低显存压力;专家模式则面向高精度、跨领域、强逻辑的复杂推理任务,依托动态专家激活与梯度隔离提升专业领域准确率。本文基于DeepSe

Gemini技术报告解码:900人工程团队背后的AI落地逻辑

大模型已从算法竞赛迈入系统工程时代。Transformer架构虽仍是基础,但决定AI能否真实落地的核心,早已转向数据治理、跨模态对齐、端云协同部署与全球合规适配等工程能力。Gemini技术报告以256页详实附录揭示:高质量多模态训练数据需三轮母语者校验,跨模态对齐必须按临床风险分级设定容忍度,而隐私计算网关的可行性高度依赖专用硬件加速。这些实践直指当前产业痛点——模型指标易刷,系统鲁棒难建。报告中

    共 74 条
  • 1
  • 2
  • 3
  • 8
  • 请选择