CV视觉个人主页

@2401_83878212

CV视觉

2024-07-10 10:16:23 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习论文a+论文b=论文c？

本人前些年的工作是深度学习的大量灌水，我从事的是图像增强与去噪的方向，网络结构异常简单，因此创新的方向一般就两个，一个是特征提取的创新，一个是图像亮度增强/去噪方向的创新。上述都是特征提取的A+B，一般都可以很好的提升特征提取能力，想更进一步，我推荐更改多尺度结构或者一些剪枝的策略吧，看过很多离谱的魔改，让人瞠目结舌。你可以直接替换普通的通道注意力机制，比如AFF非常水的通过并联全局注意力和局部注

#深度学习 #人工智能 #机器学习 +4

综述 | 基于深度学习的目标检测算法

Mask R-CNN 是基于 Faster R-CNN 的基础上演进改良而来，不同于 Faster R-CNN，Mask R-CNN 可以精确到像素级输出，完成分割任务。此外他们的输出也有所不同。Faster R-CNN 输出为种类标签和 box 坐标，而 Mask R-CNN 则会增加一个输出，即物体掩膜 (object mask)。Mask R-CNN 结构如下图：图 11。

#目标检测 #人工智能 #机器学习 +4

深度学习论文a+论文b=论文c？

#深度学习 #人工智能 #机器学习 +4

大型语言模型对齐技术综述：RLHF、RLAIF、PPO、DPO 等

对于奖励模型，子主题包括：1. 显式奖励模型与隐式奖励模型；随着自监督学习的进步、预训练语料库中数万亿标记的可用性、指令微调以及具有数十亿参数的大型Transformer的发展，大型语言模型（LLMs）现在能够生成符合事实且连贯的人类查询响应。在本工作中，我们旨在填补这一空白，将这些论文分类为不同主题，并提供每种对齐方法的详细解释，从而帮助读者全面了解该领域的现状。主要包括四个方向：1. 奖励模型

#人工智能 #自动驾驶 #深度学习 +3

关于RAG系统在多轮对话中的问题改写(优化)方法—使用历史记录改写问题

基于大模型的RAG多轮对话功能，其检索增强的流程和实际业务的场景可能会存在一定的冲突，而这个平衡点却很难把握。在之前的文章中有讲过一个RAG检索优化的方法论，简单来说就是通过对问题进行改写和优化；比如说用户输入一个问题query，但由于我们无法控制用户的行为，因此用户输入的内容query可以是任何东西，包括可能存在错别字，语义错误，甚至是一些无意义内容。面对这种情况，特别是在多轮对话过程中会导致一

#人工智能 #机器学习 #深度学习 +1

AI Agent案例实践：三种智能体开发模式详解之一（手写代码）

本文介绍了基于AI Agent的高考数据分析实践案例，通过三种开发模式（手写代码、LangChain框架、QwenAgent框架）实现从自然语言查询到结构化数据分析的完整流程。案例以2016-2024年高考数据为样本，通过RAG检索、NL2SQL转换、数据查询和智能分析等环节，展示了如何构建一个能理解用户自然语言查询并返回分析结果的AI系统。文章详细阐述了手写代码实现方案，包括元数据管理、语义检索

#android #人工智能 #深度学习 +3

刷屏了，吴恩达又一AI大模型力作！（附PDF）

该手册凝聚了专家们的心血，内容丰富，共计 373 页的PDF，从基础知识到高级应用，一一为你剖析。不论你是刚接触人工智能的新手，还是刚刚步入研究生阶段的学者，本书都将是你理想的导航。通过本手册，你将学会如何利用 ChatGPT 提供的 API 开发一个智能问答系统，涵盖大语言模型的基本规范、输入分类与监督评估、思维链推理与链式提示处理，以及系统输出的检查与评估。无论你是为了学术研究，还是商业应用，

#人工智能 #自然语言处理 #机器学习 +3

手把手教你给MCP工具做“体检”！

随着大语言模型(LLM)发展为“智能操作员”MCP协议降低了工具接入门槛但也带来安全隐患。MCPScan是一款专为MCP生态设计的开源安全扫描框架，采用静态分析与智能推理双引擎模式，能有效识别三类典型风险：任意代码执行、间接提示注入和功能描述误导。该工具通过模块化流水线工作，已在实战中发现约20个高风险服务，证明其能有效检测“文本层面恶意”转化为系统风险的情况。MCPScan为开发者、平台方和安全

#人工智能 #机器学习 #目标检测 +4

LangChain 官方教程：修复大模型上下文的6大实用技巧

大语言模型在处理长文本时易出现“上下文腐烂&quot”问题，表现为遗忘初始要求或事实错误。LangChain开源项目提出6种解决方案：1）RAG检索增强生成，仅提供最相关信息；2）工具筛选，按需选择工具；3）上下文隔离，任务分派专属智能体；4）上下文剪枝，去除无关内容；5）上下文总结，压缩关键信息；6）上下文卸载，使用外部存储管理记忆。这些方法可有效提升长文本处理效果，适用于AI应用开发。

#人工智能 #深度学习 #神经网络 +2

从零实现 vLLM (1.1）：并行词嵌入 VocabParallelEmbedding

在自然语言处理（NLP）和机器学习中，Embedding 是一种将离散的类别变量（例如词汇表中的单词）转换为连续的、低维度的向量表示的技术。计算机无法直接理解“猫”或“狗”这样的文本，它们需要数字化的输入。

#人工智能 #机器学习 #深度学习 +1

共 39 条

请选择