logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

多模态与主流模型架构

ViT(Vision Transformer)的核心思想是将标准的 Transformer 架构直接应用于图像处理:将图像视为序列,直接应用 Transformer,打破 CNN 的局限性(局部性、平移等变性)。在包含 4 亿个图文对的大规模数据集上进行预训练,目标是让模型学习到图像和文本之间细粒度的对应关系。SAM 是一个用于图像分割的提示基础模型,其设计目标是实现“可提示的分割”。视觉与文本的

#架构
PII与LLM隐私保护实战指南

PII = Personally Identifiable Information(个人身份可识别信息),指任何能够单独或结合其他信息识别出具体个人身份的数据。不同地区和法规对 PII 的定义略有差异,但核心都是能够定位到特定个人的信息。PII 的保护不仅是数据字段的问题,更是系统设计的问题。在 AI 时代,数据流动越来越频繁,LLM 的使用也越来越广泛,保护 PII 需要从技术、流程、人员等多个

#人工智能
重塑WPF辉煌?基于DirectX 12的现代.NET UI框架Jalium

Jalium.UI 不是一个小打小闹的玩具项目,而是一次认真的尝试:用现代技术栈重新实现WPF的设计理念。它保留了WPF开发者熟悉的编程模型,同时用DirectX 12替换了老旧的MilCore渲染层,用Source Generator替代了运行时反射,用.NET 10的最新特性提升了开发体验。87个以上的控件、完整的动画和效果系统、灵活的标记语言……这些足以证明其野心。虽然目前还是一个年轻的项目

#wpf#.net#ui
深入剖析 nanobot:轻量级 AI Agent 框架的架构之道

nanobot 并没有发明新的算法,它的高明之处在于工程实现的克制与优雅极简的接口设计:让接入一个新的 IM 渠道变得异常简单。巧妙的 Prompt 工程:利用虚拟工具解决了结构化输出的难题。务实的记忆管理:通过分层存储,在 Token 消耗和记忆持久性之间找到了平衡。

#人工智能#架构#前端
跨平台 UI 工程的 Agentic 转型:MCP 在 Avalonia 生态中的深度应用与架构演进

对于专业的.NET 开发者而言,积极拥抱 MCP 不仅仅是为了提高编写 XAML 的速度,更是为了在 Agentic AI 时代重塑自己的工程角色,将精力从繁琐的“像素微调”中解放出来,投入到更具创造性的架构设计之中。如果一个框架能够让 AI 更好地理解其运行时状态,那么该框架的开发效率将获得指数级的提升,从而吸引更多的开发者。例如,一个 AI 代理可以同时控制一个运行在 Web 上的管理后台和一

#ui#架构
计算机视觉 第一周:卷积基础知识 课后习题和代码代码实践

它不和SKILLS、SUBAGENTS一样按需加载,它会一直存在于上下文中,所以要尽量小的占用上下文,要做到只放重要信息和你的特殊要求。你可以在这个文件加入强制它执行规划的提示,如“每次实现新功能的时候,先规划一下然后反思一下规划,有不明白的要向我提问,直到我明确提出执行计划你才能开始编写代码”你添加一个接口的时候,让Claude按照你的目录的规划来实现各自的代码,而不是自己创建新的目录和文件来实

你以为在给 AI 下命令,其实你在改写它的概率分布

模型并不知道自己在执行什么任务。Prompt 的作用是让模型判断:写作语境问答语境分类语境推理语境这不是通过“理解任务”实现的,而是通过:👉上下文模式识别。

#人工智能#机器学习#深度学习
你以为在给 AI 下命令,其实你在改写它的概率分布

模型并不知道自己在执行什么任务。Prompt 的作用是让模型判断:写作语境问答语境分类语境推理语境这不是通过“理解任务”实现的,而是通过:👉上下文模式识别。

#人工智能#机器学习#深度学习
深度学习入门

因为它是连续可微的函数,能量化模型预测与真实标签的差异,其梯度可指导参数沿“减小误差”的方向更新;因为神经网络学习的目标是最小化损失函数,负梯度方向是损失函数值减小最快的方向,沿该方向更新参数能高效逼近损失函数的最小值(或局部最小值)。通过调整未知的权重参数和偏置参数,最小化损失函数的值,让模型具备对测试数据的泛化识别能力,实现模型对未知数据的稳定预测。在几何意义上,梯度是损失函数在当前参数点处的

#深度学习#人工智能
我不允许谁还不清楚function call在AI-Agent领域中打手的地位

而当你希望大模型能使用一些工具自行获取所需的信息、执行一些动作,就需要使用 Tool 来实现了,拥有了 Tool 的大模型就像是拥有了手脚,可以和当下已有的 IT 基础设施进行交互。从三次请求对话来看, LLM在三次对话的响应中体现了它的思考和逻辑步骤,应用持续被LLM引导做出行动,同时LLM也持续对应用的行为做出进一步观察和思考。来完成,chain是一种特殊的、简化的graph,chain不能回

#人工智能#前端
到底了