AIGCmagic社区个人主页

@AIGCmagic

AIGCmagic社区

2024-03-26 17:04:07 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI多模态论文解读：LLaVA-CoT：让视觉语言模型逐步推理

LLaVA-CoT（Let Vision Language Models Reason Step-by-Step），一种旨在通过多阶段推理来增强视觉语言模型（VLM）系统性和结构性推理能力的新模型。LLaVA-CoT将答案生成过程分解为四个结构化推理阶段：总结、标题、推理和结论。模型提供问题的高层次总结，概述将要解决的问题的主要方面。如果存在图像，模型提供与问题相关的视觉元素的简洁概述，帮助理解多

#人工智能 #语言模型 #深度学习

每日一篇SCI：DeepSeek专属论文写作“喂饭”秘籍

提供研究背景、目的、方法、结果和结论的简要描述。

#人工智能 #机器学习 #深度学习

AI多模态实战教程：面壁智能MiniCPM-V多模态大模型问答交互、llama.cpp模型量化和推理

MiniCPM-V 2.0，这是MiniCPM系列的多模态版本。MiniCPM-V 2.0显示出强⼤的OCR和多模态理解能⼒，在开源模型中的OCRBench上表现出⾊，甚⾄在场景⽂本理解上可以与Gemini Pro相媲美。MiniCPM-V 系列是专为视觉-语⾔理解设计的多模态⼤型语⾔模型（MLLMs），提供⾼质量的⽂本输出，已发布4个版本。# 下载模型，以int4量化的MiniCPM-Llama

#人工智能 #交互

AI多模态教程：从0到1搭建VisualGLM图文大模型案例

中英文多模态大模型VisualGLM-6B微调部署全流程

#人工智能 #AIGC

AI多模态教程：从0到1搭建VisualGLM图文大模型案例

中英文多模态大模型VisualGLM-6B微调部署全流程

#人工智能 #AIGC

AI多模态教程：从0到1搭建VisualGLM图文大模型案例

中英文多模态大模型VisualGLM-6B微调部署全流程

#人工智能 #AIGC

AI多模态教程：从0到1搭建VisualGLM图文大模型案例

中英文多模态大模型VisualGLM-6B微调部署全流程

#人工智能 #AIGC

DeepSeek专题：DeepSeek-V3核心知识点速览

自研 MoE 模型，671B 参数，激活 37B，在 14.8T token 上进行了预训练，用于解决大语言模型的高效推理和训练问题。多头潜在注意力（MLAMLA架构通过低秩联合压缩注意力键和值来减少推理过程中的KV缓存，从而提高推理效率。DeepSeekMoE架构使用细粒度的专家并行和隔离一些专家作为共享专家，以提高训练效率。无辅助损失的负载均衡为了最小化辅助损失对模型性能的影响，提出了一种无辅

#人工智能 #AIGC #机器学习

AI多模态教程：从0到1搭建VisualGLM图文大模型案例

中英文多模态大模型VisualGLM-6B微调部署全流程

#人工智能 #AIGC

AI多模态教程：从0到1搭建VisualGLM图文大模型案例

中英文多模态大模型VisualGLM-6B微调部署全流程

#人工智能 #AIGC

共 12 条

请选择