十铭忘个人主页

@shimingwang

十铭忘

2022-11-16 16:40:31 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI画架构图的方法

仅供参考，未经实验验证问题1我发现让kimi画架构图的时候有两种，一种直接画，这是用的什么画法？另一种是写代码，这是用python实现的吗？用了什么库？Kimi做ppt的时候可以在ppt里面添加可编辑的元素，那如果要用AI画架构图，并且里面的元素是可编辑的，要怎么做？回答1我来帮你梳理清楚这三种方式的原理和实现路径。先搜索一下当前AI生成可编辑架构图的最新方案：你观察得很敏锐。这两种方式的本质区别

#人工智能

infoGCN++的理解4——数据预处理之去噪的pkl转npz

上一篇去噪之后我们会得到raw_denoised_joints.pkl，这一篇首先要根据skeleton文件名生成元数据（一些txt文件），然后运行seq_transformation.py。注意预处理的脚本都要在data/ntu路径下运行。seq_transformation.py将去噪后的骨架数据（.pkl）进行归一化、对齐、划分，生成可直接用于模型训练的.npz数据集，并支持两种官方评估协议

#人工智能

贝叶斯推断、隐马尔可夫模型、卡尔曼滤波

问题：贝叶斯推断、隐马尔可夫模型、卡尔曼滤波与现代神经网络的区别和联系是什么？为什么感觉其过程非常像神经网络的前向传播和反向传播？对比一下回答1：贝叶斯/HMM/卡尔曼滤波是在"猜世界的状态"，神经网络是在"学一个输入到输出的映射函数"。你感觉像，是因为它们都有"信息流动"和"误差修正"的过程，但目的完全不同，就像"侦探推理案件"和"学生刷题考试"都涉及思考，但根本不是一回事。贝叶斯/HMM/卡尔

#机器学习 #人工智能 #深度学习

强化学习3——基本概念：状态、动作、状态转移、条件概率

参考资料：1.赵世钰《强化学习的数学原理》GitHub仓库：https://github.com/MathFoundationRL/Book-Mathematical-Foundation-of-Reinforcement-Learning注：书中有更加易懂和完善的内容，这里只是笔记性质。考虑如图1.2所示的例子，其中一个机器人在网格世界中移动。该机器人，被称为agent，可以在网格中相邻的单元格

#人工智能

强化学习1——学习路线

调研了一下现在强化学习有哪些学习资料，最后我打算沿着这个《强化学习的数学原理》的路线学习，因为我之前看过这个教程。还有就是DeepSeek和Kimi的论文也要看一下。项目内容身份DeepMind 首席研究员（Principal Research Scientist）学术背景博士毕业于阿尔伯塔大学，师从 Richard Sutton（强化学习之父）核心贡献在Nature上发表了 DQN 论文，主导设

#人工智能

Controlnet的理解1——引言和相关工作

参考资料：Controlnet原论文论文地址：https://arxiv.org/pdf/2302.05543ControlNet的作者团队由斯坦福大学的博士生张吕敏（Lvmin Zhang）领衔，另两位合作者分别是现香港科技大学的助理教授饶安逸（Anyi Rao）和斯坦福大学的Maneesh Agrawala教授。👤 核心作者：张吕敏（Lvmin Zhang）个人代号：昵称是 “lllyasv

#人工智能

FLUX.1架构的理解9——从组件式拼接到端到端统一

在之前我主要是在看这篇论文：论文地址：https://arxiv.org/pdf/2507.09595看完这篇论文我现在已经有一些理解了Flux.1的架构，主要是理解了文生图是怎么实现的，但是我还有一些问题，这篇就是回答这些问题，但是回答涉及的一些维度变化，以及具体的原理还需要再看一些论文和代码才能有更清楚地理解，现在只是了解一下。你的问题答案为什么有 FLUX.1 + Inpainting Co

#人工智能

FLUX.1架构的理解8——模型、工具、架构图解

仅供参考，未经实验验证。参考资料：论文地址：https://arxiv.org/pdf/2507.09595潜在空间操作 (Latent Space Operation)：通过在压缩的潜在空间中进行大部分计算，显著提高了图像生成的速度和效率，同时保持了视觉质量。Transformer 作为核心骨干 (Transformer Backbone)：放弃了传统的 U-Net 结构，转而采用全 Trans

#人工智能

FLUX.1架构的理解3——FLUX.1 采样流程之初始化和预处理

仅供参考，未经实验验证。参考资料：论文地址：https://arxiv.org/pdf/2507.09595T5 逐 token 嵌入：提供精细的语义指导。它使得 FLUX.1 能够理解复杂、多元素的提示，准确生成图像中的特定对象、属性和它们之间的关系。例如，在“一辆在雪天行驶的红色跑车”这样的提示中，T5嵌入能帮助模型区分“红色”和“跑车”并准确结合。CLIP 整体嵌入：提供全局的视觉概念对齐。

#人工智能

FLUX.1架构的理解2——Transformer的注意力机制

仅供参考，未经实验验证。参考资料：论文地址：https://arxiv.org/pdf/2507.09595该公式是 Transformer 架构中自注意力机制的核心，通过计算查询与键的点积相似度，并经过缩放和softmaxsoftmax归一化后，得到注意力权重，再将这些权重与值向量加权求和，从而为输入序列中的每个元素生成一个融合了上下文信息的新的表示。这一机制使得模型能够捕捉序列内部的长距离依赖

#人工智能

共 30 条

请选择