
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本人前些年的工作是深度学习的大量灌水,我从事的是图像增强与去噪的方向,网络结构异常简单,因此创新的方向一般就两个,一个是特征提取的创新,一个是图像亮度增强/去噪方向的创新。上述都是特征提取的A+B,一般都可以很好的提升特征提取能力,想更进一步,我推荐更改多尺度结构或者一些剪枝的策略吧,看过很多离谱的魔改,让人瞠目结舌。你可以直接替换普通的通道注意力机制,比如AFF非常水的通过并联全局注意力和局部注

Mask R-CNN 是基于 Faster R-CNN 的基础上演进改良而来,不同于 Faster R-CNN,Mask R-CNN 可以精确到像素级输出,完成分割任务。此外他们的输出也有所不同。Faster R-CNN 输出为种类标签和 box 坐标,而 Mask R-CNN 则会增加一个输出,即物体掩膜 (object mask)。Mask R-CNN 结构如下图:图 11。

本人前些年的工作是深度学习的大量灌水,我从事的是图像增强与去噪的方向,网络结构异常简单,因此创新的方向一般就两个,一个是特征提取的创新,一个是图像亮度增强/去噪方向的创新。上述都是特征提取的A+B,一般都可以很好的提升特征提取能力,想更进一步,我推荐更改多尺度结构或者一些剪枝的策略吧,看过很多离谱的魔改,让人瞠目结舌。你可以直接替换普通的通道注意力机制,比如AFF非常水的通过并联全局注意力和局部注

对于奖励模型,子主题包括:1. 显式奖励模型与隐式奖励模型;随着自监督学习的进步、预训练语料库中数万亿标记的可用性、指令微调以及具有数十亿参数的大型Transformer的发展,大型语言模型(LLMs)现在能够生成符合事实且连贯的人类查询响应。在本工作中,我们旨在填补这一空白,将这些论文分类为不同主题,并提供每种对齐方法的详细解释,从而帮助读者全面了解该领域的现状。主要包括四个方向:1. 奖励模型

基于大模型的RAG多轮对话功能,其检索增强的流程和实际业务的场景可能会存在一定的冲突,而这个平衡点却很难把握。在之前的文章中有讲过一个RAG检索优化的方法论,简单来说就是通过对问题进行改写和优化;比如说用户输入一个问题query,但由于我们无法控制用户的行为,因此用户输入的内容query可以是任何东西,包括可能存在错别字,语义错误,甚至是一些无意义内容。面对这种情况,特别是在多轮对话过程中会导致一

本文介绍了基于AI Agent的高考数据分析实践案例,通过三种开发模式(手写代码、LangChain框架、QwenAgent框架)实现从自然语言查询到结构化数据分析的完整流程。案例以2016-2024年高考数据为样本,通过RAG检索、NL2SQL转换、数据查询和智能分析等环节,展示了如何构建一个能理解用户自然语言查询并返回分析结果的AI系统。文章详细阐述了手写代码实现方案,包括元数据管理、语义检索

该手册凝聚了专家们的心血,内容丰富,共计 373 页的PDF,从基础知识到高级应用,一一为你剖析。不论你是刚接触人工智能的新手,还是刚刚步入研究生阶段的学者,本书都将是你理想的导航。通过本手册,你将学会如何利用 ChatGPT 提供的 API 开发一个智能问答系统,涵盖大语言模型的基本规范、输入分类与监督评估、思维链推理与链式提示处理,以及系统输出的检查与评估。无论你是为了学术研究,还是商业应用,

随着大语言模型(LLM)发展为“智能操作员”MCP协议降低了工具接入门槛但也带来安全隐患。MCPScan是一款专为MCP生态设计的开源安全扫描框架,采用静态分析与智能推理双引擎模式,能有效识别三类典型风险:任意代码执行、间接提示注入和功能描述误导。该工具通过模块化流水线工作,已在实战中发现约20个高风险服务,证明其能有效检测“文本层面恶意”转化为系统风险的情况。MCPScan为开发者、平台方和安全

大语言模型在处理长文本时易出现“上下文腐烂"”问题,表现为遗忘初始要求或事实错误。LangChain开源项目提出6种解决方案:1)RAG检索增强生成,仅提供最相关信息;2)工具筛选,按需选择工具;3)上下文隔离,任务分派专属智能体;4)上下文剪枝,去除无关内容;5)上下文总结,压缩关键信息;6)上下文卸载,使用外部存储管理记忆。这些方法可有效提升长文本处理效果,适用于AI应用开发。

在自然语言处理(NLP)和机器学习中,Embedding 是一种将离散的类别变量(例如词汇表中的单词)转换为连续的、低维度的向量表示的技术。计算机无法直接理解“猫”或“狗”这样的文本,它们需要数字化的输入。








