weixin_30740295 个人主页

@weixin_30740295

weixin_30740295

2022-08-23 13:42:10 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

TANGO是一个开源的分布控制系统

TANGO是一个开源的分布式控制系统，它基于CORBA构建，所以跨平台，目前已经在window ，linux，solaris上实现，它的核心是把每个采集控制的设备看做一个device server，通过上层封装给客户端提供简易的接口，更详细内容请期待我即将翻译完的TANGO用户手册转载于:https://www.cnblogs.com/zhangyang/archive/2007/08/29...

Transformer位置编码技术演进与自适应优化方案

位置编码是Transformer架构处理序列数据的关键技术，其核心作用是为模型注入序列顺序信息。从早期的绝对位置编码到相对位置编码（Relative Position Embedding）和旋转位置编码（RoPE），技术演进始终围绕如何更好地建模长程依赖关系。这些方法通过不同的数学变换实现位置感知，但在处理超长序列时仍面临注意力分散、梯度消失等挑战。自适应位置编码（APE）创新性地引入熵感知旋转机

基于OpenClaw与WisGate API构建个人第二大脑：语义搜索与知识管理实践

在信息爆炸的时代，高效的知识管理成为开发者和研究者的核心需求。语义搜索技术通过将文本转化为高维向量，实现了基于含义而非关键词的智能检索，其原理是利用嵌入模型捕捉文本的深层语义关系。这项技术的核心价值在于构建可理解用户意图的外部知识系统，显著提升信息查找和利用效率。在工程实践中，结合开源AI记忆代理与强大的模型API，可以搭建私有化部署的个人知识库。本文以OpenClaw和WisGate API为例

供应链攻击深度解析：从Python依赖漏洞到AI应用安全防御

软件供应链安全是当今开发领域的关键议题，它涉及从代码编写到部署运行的整个生命周期。其核心原理在于，现代应用高度依赖开源生态，任何第三方组件的安全漏洞都可能成为攻击入口。这种攻击方式的技术价值在于，它能绕过传统边界防御，直接渗透到应用内部。在AI应用开发场景中，由于大量使用开源模型集成工具，供应链风险尤为突出。例如，近期发生的针对LiteLLM等AI网关组件的攻击事件，就利用了Python包管理机制

CTCLoss的‘潜规则’与实战避坑指南：为什么你的语音识别模型不收敛？

本文深入探讨了CTCLoss在语音识别模型中的三大隐形成本与调优策略，包括输入输出长度关系、条件独立假设和单调对齐约束的实战影响。通过具体案例和代码示例，提供了针对中文语音识别、混合损失函数和多说话人场景的优化方案，帮助开发者解决模型不收敛问题并提升训练效率。

#语音识别

NVIDIA GTC 2023深度解析：生成式AI全栈基础设施与工程实践指南

在人工智能领域，计算基础设施正经历从以计算为中心到以数据为中心的范式转变。其核心原理在于，随着大模型参数量的爆炸式增长，训练和推理的瓶颈已从浮点运算能力转向内存带宽与互联带宽。这一转变的技术价值在于，它能显著降低海量数据搬运带来的能耗与时间开销，是支撑大模型经济可行性的物理基础。其应用场景广泛覆盖了云端大规模训练、边缘低延迟推理以及终端设备感知。以NVIDIA GTC 2023发布的全栈解决方案为

#生成式AI

印度教师与微软共创AI教育工具：以用户为中心的设计实践

在教育科技领域，以用户为中心的设计（UCD）理念正成为AI应用开发的关键方法论。其核心原理是通过深度理解一线用户的真实需求，将技术方案与具体场景紧密结合，从而提升产品的可用性和有效性。这种设计模式的技术价值在于能够构建出真正解决实际问题的工具，避免技术驱动的产品脱离实际。在教育场景中，AI工具需要理解教学准确性、认知适龄性、互动性等多维度质量标准，这通常通过“人在回路”的机器学习模式实现，让教师反

LazyGraphRAG：基于图结构与懒惰策略的高效RAG系统设计与实践

检索增强生成（RAG）是大模型应用落地的关键技术，它通过检索外部知识库来增强生成内容的准确性与可靠性。其核心原理是将用户查询与向量化文档片段进行匹配，并将相关上下文输入大模型以生成答案。这项技术的价值在于有效缓解了大模型的幻觉问题，并提升了专业领域问答的准确性。然而，传统RAG方案常面临检索噪声大、处理长文档能力有限以及API调用成本高昂等挑战。在实际应用场景中，如企业知识库助手、智能客服和文档分

#RAG

DeepSeek双模式推理：快速模式与专家模式技术解析

大模型推理架构正从单一模式走向场景化分治，核心在于平衡计算效率、响应延迟与任务复杂度。动态剪枝、混合专家（MoE）路由、KV Cache优化等关键技术，使模型能在不同负载下自适应分配算力。其中，快速模式聚焦轻量级实时交互与批量处理，通过上下文感知重要性评分与选择性缓存降低显存压力；专家模式则面向高精度、跨领域、强逻辑的复杂推理任务，依托动态专家激活与梯度隔离提升专业领域准确率。本文基于DeepSe

Gemini技术报告解码：900人工程团队背后的AI落地逻辑

大模型已从算法竞赛迈入系统工程时代。Transformer架构虽仍是基础，但决定AI能否真实落地的核心，早已转向数据治理、跨模态对齐、端云协同部署与全球合规适配等工程能力。Gemini技术报告以256页详实附录揭示：高质量多模态训练数据需三轮母语者校验，跨模态对齐必须按临床风险分级设定容忍度，而隐私计算网关的可行性高度依赖专用硬件加速。这些实践直指当前产业痛点——模型指标易刷，系统鲁棒难建。报告中

共 74 条

请选择