极深个人主页

@weixin_43156294

极深

2024-02-19 11:40:23 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

数据标签≠简单分类：分清标签、标注、特征

1.特征是“原料”，是数据自带的属性，是一切加工的基础；2.标签是“半成品”，是对特征的提炼，服务于业务决策；3.标注是“加工过程”，是给原始数据贴标签的动作，服务于AI训练。其实三者的逻辑很简单：先有特征（原始数据），通过标注（动作）给原始数据贴标签（结果），再把标签用于业务或模型优化。搞懂这个逻辑，再也不会把三者混为一谈，数据落地也会更高效。

#人工智能 #数据挖掘

小样本/弱监督下：注意力可视化帮你发现脏数据

在机器学习模型训练中，数据质量是决定模型性能的核心基石——“垃圾进，垃圾出”的道理早已成为行业共识。但在小样本、弱监督这两类常见的现实场景中，数据质量问题往往更隐蔽、更难排查，进而导致模型过拟合、泛化能力差、决策偏差等一系列问题。小样本场景下，标注数据稀缺，模型难以学习到足够的有效特征，极易被数据中的噪声误导；弱监督场景下，标签往往较为粗糙（如仅提供图像级标签而非像素级标签、文本级标签而非toke

#人工智能

注意力可视化在风控/推荐/问答系统中的实际作用

无论在风控、推荐还是问答系统中，注意力可视化的核心价值均围绕“可解释性、可优化性、可落地性”展开：一是打破模型黑箱，让决策逻辑可直观、可追溯，满足业务合规与用户信任需求；二是辅助模型调试与优化，降低运维成本，提升系统性能（精准度、匹配度、准确率）；三是衔接技术与业务，让技术人员与业务人员快速达成共识，加速模型落地。

多模态模型（图文）注意力对齐

多模态模型（图文）中，文字“指向”图像区域的本质，是通过交叉注意力机制，将文本token与图像区域特征在统一语义空间中进行精准匹配，再通过注意力权重的分配，实现语义层面的双向绑定。从特征提取、统一映射，到交叉注意力的“匹配-加权-聚合”，再到对比学习、注意力引导等辅助策略，每一步都在解决“模态异构”“粒度不匹配”等核心问题，让模型逐步实现“所见即所言、所言即所见”。

注意力权重分布

峰值分布=“抓单点核心”，聚焦少数关键信息；均匀分布=“无差别对待”，无法区分信息重要性；稀疏分布=“抓多点关键、过滤无用”，兼顾全面性与聚焦性。其分布形态直接由模型架构、训练数据和任务需求决定。

注意力可解释性：它真的学到句法/语义了吗？

自Transformer架构成为自然语言处理（NLP）的主流框架，注意力机制便被赋予了“可解释性窗口”的期待——那些直观的热力图的高亮区域，似乎在告诉我们模型“关注”了哪些词元，进而让人推测：模型是否通过注意力权重，真正掌握了人类语言的句法规则与语义关联？然而，从2019年《Attention is not Explanation》的警示，到2026年最新研究揭示的“可视化幻象”，学界逐渐意识到：

迁移学习（Transfer Learning）

迁移学习的灵感源于人类认知的基本规律：孩童在学会数数后，学习加减法会更轻松；厨师掌握中餐烹饪技巧后，钻研西餐时对火候、调味的理解会更快——这种“旧知识助力新知识学习”的能力，正是迁移学习试图赋予AI的核心特质。从学术角度定义，迁移学习是“将从源领域（Source Domain）和源任务（Source Task）中学习到的知识，应用于目标领域（Target Domain）和目标任务（Target T

#迁移学习 #人工智能 #机器学习

视频处理深度学习模型（TimeSformer）

视频数据的高效处理已然成为学术研究与产业应用的关键焦点。海量的视频数据蕴含着丰富的时空信息，从安防监控中的行为识别，到影视娱乐中的内容分析，再到自动驾驶中的场景感知，对视频数据的精准解读需求与日俱增。传统的卷积神经网络（CNN）凭借强大的特征提取能力，在图像识别领域斩获了令人瞩目的成绩，成功实现了对图像中物体、场景的高精度分类与定位。然而，视频数据作为连续的图像帧序列，不仅包含空间维度上的视觉信息

#音视频 #深度学习 #人工智能

语言模型集成框架（Haystack）

Haystack提供模块化架构，支持多种文档存储方案，可与广泛使用的语言模型无缝集成，具有可扩展架构以处理海量文档，还拥有简洁易用的API，便于构建自定义的NLP工作流。适用于构建端到端的问答和搜索系统，特别适合需要处理大量文档和与多种语言模型集成的场景。其主要目标是帮助开发者更方便地构建强大的NLP应用程序，如问答系统、语义搜索和文档摘要等。它提供了一个灵活的框架，能够将不同的NLP组件（如语言

#语言模型 #人工智能

检索增强型语言模型（OpenScholar by Allen AI）

外接4500万篇论文的数据库，采用检索增强的方法，通过数据存储、bi-encoder检索器、cross-encoder重排序器等组件，从大量文献中筛选出与输入查询语义相关的段落，为LLM生成关键词提供丰富的学术文献依据。由艾伦人工智能研究所（AI2）和华盛顿大学共同开发。面对全球科研论文数量爆炸式增长，科研人员面临严重信息过载，而现有通用AI工具如ChatGPT等在处理科学问题时存在生成幻觉、成本

#人工智能 #语言模型 #自然语言处理

共 671 条

请选择