logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习走出代码和数学,让RL适用于医疗领域,自由格式不再是障碍

可验证奖励(RLVR)在医疗场景下,本质上依赖「有权威或高质量的标准答案/指南」来给模型输出打分,从而实现强化学习的训练闭环。不同子场景(诊断、用药、护理、考试等)都可以依赖“参考答案(文本或结构化)” + “生成式奖励模型”来判定回答与标准的一致程度。在实践中,需要注意数据质量、模型安全性、以及医疗本身的专业复杂度,多使用 soft reward 和多维度判分方式来兼容不确定性。需要对高风险场景

文章图片
#人工智能
Bi-LSTM-CRF:其结合了 BI-LSTM 的上下文捕获能力和 CRF 的标签关系建模

BI-LSTM-CRF模型的独特优势在于它结合了双向LSTM的能力来捕获长距离的双向上下文依赖性,并通过CRF层来精确地建模标签之间的约束关系,从而在复杂的序列标注任务中提供了显著的性能提升。本节中,我们描述了本文中使用的模型:LSTM、BI-LSTM、CRF、LSTM-CRF和BI-LSTM-CRF。这些模型包括LSTM网络、双向LSTM(BI-LSTM)网络、带有条件随机场(CRF)层的LST

文章图片
#lstm#人工智能#rnn
【多模态大模型】BLIP-2:低计算视觉-语言预训练大模型

子问题: 如何提取并学习图像的特征表示,使之能够与文本有效结合,而不需要重新训练图像编码器?子解法使用Q-Former进行视觉语言表示学习。Q-Former通过与冻结的图像编码器的交互来提取视觉特征,并通过自注意力和交叉注意力层来学习这些视觉特征与相关文本之间的对应关系。之所以使用此解法,是因为冻结的图像编码器具有高质量的视觉表示,而Q-Former可以在不改变这些预训练模型的前提下,学习这些特征

文章图片
#人工智能
【多模态大模型】CLIP 对比预训练 + 文字图像相似度:如何训练中文视觉大模型?

例如,我们可以利用互联网上的图像和相关联的文本数据,比如从社交媒体、图像搜索引擎或图像描述数据集中获取图像-文本对,不用人工标注。传统方法:要构建一个图像-文本匹配数据集,需要收集大量的图像和与之相关联的文本描述,并对它们进行人工标注。CLIP 模型是一种基于对比学习的模型,可以将图像和文本进行联合编码,从而实现图像和文本之间的交叉检索。比如图像和文本的匹配任务中,模型需要区分正样本(真实的图像-

文章图片
#深度学习
【多模态大模型】Latent Diffusion:在潜在空间而非像素空间进行操作,从而减少了计算复杂度

潜在扩散(Latent Diffusion)是一种处理和生成图像的方法,它通过在潜在空间而非直接在像素空间处理数据来提高效率和质量。

文章图片
#人工智能
MedTsLLM:基于 LLM 实现多模态医疗时间序列分析,包含语义分割、边界检测和异常检测

这个模型的表现优于现有方法,表明它成功捕捉到了医疗数据中的基本模式和关系。这个分析遵循了从原始数据收集,通过模式发现和相关性分析,最终发展出一个可用于未来预测和分析的数学/计算模型的归纳推理过程。这个框架的创新之处在于它首次将LLM技术应用于医疗时间序列分析,并通过多模态融合提高了分析准确性。"医疗时间序列大语言模型"是一个能将医疗数据时间化、序列化,并用语言模型理解和分析的智能系统。本框架是对传

文章图片
#人工智能
AI / Web3 科学家的进击之心:财富自由之路,能积 微分 者成功

很多人都想成功,都想赚很多钱,但是一问他,做任何行业他都没信心,都不想拼命,都想着各种退路,都想着哪个能省劲,哪个钱多活少离家近。你必须有为了实现这个目标不顾一切的狠劲,是我一定要去实现的,一定要去做的,即使放弃我现在所有的东西,哪怕我最后达不到我的目标,我都一定要为了他拼尽全力。真正能伤害你的,是你自己的放弃。以前的我习惯逃避,但现在的我是靠谱的,超越懦弱和希望,以目标为导向,以结果为标准,不惧

#web3
GNN-RAG:结合了GNN的图推理能力和LLM的语言理解能力

基于GNN-RAG的任务,我将提炼出最精华的内容,并按照您的要求进行总结和分析。提炼书籍中最精华的20%(3000字):GNN-RAG是一种创新的方法,旨在结合图神经网络(GNN)和大型语言模型(LLM)的优势,用于知识图谱问答(KGQA)任务。这种方法的核心思想是利用GNN处理复杂的图结构信息,同时借助LLM的自然语言理解和生成能力。主要组成部分:GNN组件:负责处理知识图谱的结构信息密集子图检

文章图片
#人工智能
医学大模型 + 推理完备算法设计

医学大模型的 4 类问题:怎么搞?在尝试不同方案。设置快慢双系统,快系统理解信息,慢系统辅助决策快系统是LLM,微调的医学大模型,功能是自然语义理解和对话、复杂的信息集成和洞察慢系统是临床知识图谱 + 文本向量库,把诊疗规则存在在数据库,功能是医疗决策逻辑问诊时,让慢系统控制快系统进行诊断假设、问询因子,实现临床思维检查时,把检查项目和诊断做关联存储,结合检查证据类型等级,结合风险收益算法,实现个

文章图片
#算法
【YOLO v5 v7 v8 v9小目标改进】辅助超推理SAHI:分而治之,解决高分辨率图像中小物体检测的问题

我们用这些模型在每个小块上找我们想要的小物体。这个方法可以用在任何需要找小物体的场景中,比如用监控摄像头监视一片区域,或者用无人机拍摄的大面积地图上寻找特定的小目标。但是,如果你将拼图分成几个部分,一块一块地完成,每一块拼好之后再把所有的小块合并起来,最终得到的将是一幅完整的图画。这些切片相对于原图中的小物体具有更大的像素面积,使得小物体在网络训练时变得更明显,从而提高了模型对小物体的检测性能。:

文章图片
    共 535 条
  • 1
  • 2
  • 3
  • 54
  • 请选择