xx_xxxxx_ 个人主页

@xx_xxxxx_

xx_xxxxx_

2023-10-21 21:49:30 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI的工程基础1-最优化算法

本文介绍了使用PyTorch实现线性回归模型的方法。首先通过torch.linspace生成训练数据，并进行归一化处理。然后定义了一个继承torch.nn.Module的线性回归模型类Linear，包含可训练参数a和b，并实现了前向传播方法。文章展示了两种训练方式：1) 使用PyTorch内置的SGD优化器，2) 手动实现梯度下降。两种方法在20次迭代后都成功收敛。

文章图片

#人工智能 #机器学习

Windows下Conda环境OpenSSL异常NOT_ENOUGH_DATA(_ssl.c:4194)导致HuggingFace、Datasets、PyTorch等SSL问题

说明根因不是 Python 包，而是 OpenSSL 版本导致 Windows 证书加载异常。检查 ssl.OPENSSL_VERSION、_ssl.pyd、where libssl-3-x64.dll、where libcrypto-3-x64.dll、PATH、conda list openssl 等。依次检查 HTTP_PROXY、HTTPS_PROXY、HF_ENDPOINT、aiohtt

文章图片

#conda #pytorch #人工智能 +1

AI基础0-人工智能的数学基础

本文摘要分为两部分：矩阵和概率统计。矩阵部分重点解析特征值与特征向量的几何意义，指出特征向量在变换中保持方向不变，仅按特征值比例伸缩，并通过特征值分解展示变换本质。概率部分介绍假设检验流程，包括提出假设、选择统计量、确定显著性水平和决策规则。贝叶斯定理部分则以电竞为例，说明如何通过条件概率逆向推断事件概率。全文通过几何直观和实例阐述数学概念，强调理解而非机械记忆。

文章图片

#人工智能 #机器学习

RAG/Agent/Skill/MCP/Tool

摘要：RAG（检索增强生成）通过结合外部知识库提升AI回答准确性，其流程包括数据分片、向量化存储和语义检索。相比传统方法，RAG能突破模型记忆限制，降低推理成本。Agent技术则使AI具备任务执行能力，通过工具调用和自主决策完成复杂工作。MCP协议为AI工具制定统一标准，而Skill机制将工作流程打包成可复用指令，二者分别面向开发者和终端用户。

文章图片

#机器学习 #自然语言处理 #语言模型

AI-Studio预设模型训练实操--数据集制作

不多赘述。

文章图片

多模态动态融合模型Predictive Dynamic Fusion阅读与代码分析5-校准机制与理论推导

本文提出Predictive Dynamic Fusion方法中的相对校准(RC)机制，用于动态调整多模态系统中各模态的置信度。当某模态输出分布越均匀（如文字模态输出"喜悦/自然/沮丧"均为0.9），其不确定性越高，RC值越低；输出越集中（如"喜悦0.9，其余0"），RC值越高。通过RC值调整置信度，实现模态贡献的动态平衡。理论推导部分证明了该方法能有效控制

文章图片

#人工智能 #机器学习

多模态动态融合模型Predictive Dynamic Fusion阅读与代码分析2-对比模型与底层模型的基本结构

本文介绍了多模态融合的三种主要方法：传统静态晚期融合(LateFusion)、动态多模态融合(DynMM)和质量感知多模态融合(QMF)。LateFusion在预测阶段整合各模态独立训练结果；DynMM通过动态机制调整融合策略；QMF则基于模态质量评估进行自适应融合。论文还涉及四种基础模型：词袋模型(BOW)、BERT文本编码器、ResNet图像编码器和MMBT多模态Transformer。通过对

文章图片

多模态动态融合模型Predictive Dynamic Fusion阅读与代码分析运行1-信度概念与基础参数指标

本文解析了《Predictive Dynamic Fusion》论文的核心概念与代码实现。理论部分重点探讨了置信度在多模态融合中的作用，提出Mono-Confidence（自身可靠性）和Holo-Confidence（相对可靠性）两个指标，通过协同信度确定模态权重。代码分析指出原论文存在数据集缺失、词向量文件需自行下载等问题，并修正了forward函数中的逻辑错误。参数配置部分详细说明了训练优化、

文章图片

常见多模态架构CLIP/BLIP/Llava/CogVLM

CLIP（Contrastive Language-Image Pre-Training）模型是一种多模态预训练神经网络，由OpenAI在2021年发布，是从自然语言监督中学习的一种有效且可扩展的方法。CLIP在预训练期间学习执行广泛的任务，包括OCR，地理定位，动作识别，并且在计算效率更高的同时优于公开可用的最佳ImageNet模型。该模型的核心思想是使用大量图像和文本的配对数据进行预训练，以学

#深度学习 #机器学习 #人工智能

RAG/Agent/Skill/MCP/Tool

摘要：RAG（检索增强生成）通过结合外部知识库提升AI回答准确性，其流程包括数据分片、向量化存储和语义检索。相比传统方法，RAG能突破模型记忆限制，降低推理成本。Agent技术则使AI具备任务执行能力，通过工具调用和自主决策完成复杂工作。MCP协议为AI工具制定统一标准，而Skill机制将工作流程打包成可复用指令，二者分别面向开发者和终端用户。

文章图片

#机器学习 #自然语言处理 #语言模型

共 13 条

1
2

请选择