logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

开源大模型的小白实操

本文介绍了开源大模型与非开源大模型的区别,并详细讲解了如何使用开源模型。非开源模型(如GPT系列)由大公司开发,性能强但存在隐私风险;开源模型(如Llama3、Qwen系列)可本地部署,数据隐私有保障但技术门槛较高。文章通过Qwen2.5-7B-Instruct模型为例,演示了从魔塔社区下载模型、安装依赖库到加载模型的完整流程。

文章图片
#人工智能#语言模型#开源
一堂课带你走进生成式人工智能的原理

相信大家在日常的学习生活中,或多或少都使用过 OpenAI 的 ChatGPT、Google 的 Gemini 或 Anthropic 的 Claude 等人工智能平台。这些工具确实为我们带来了极大的便利,大幅提升了工作与学习的效率。本文的主要目标是带大家揭开这些生成式人工智能的神秘面纱,对它们背后的运行原理建立一个基本的认识。发现了吗?生成式人工智能虽然看似神通广大,但其核心逻辑却极具规律性。模

#人工智能
Your Large Vision-Language Model Only Needs A Few Attention Heads For Visual Grounding阅读笔记

期刊:“CVPR” (Kang 等, 2025, p. 9339)(发表日期:2025Seil Kang;摘要翻译:(视觉定位)旨在根据自由文本描述定位图像中的相应区域。最近,强大的多模态能力推动了视觉定位任务的实质性提升,尽管这些模型不可避免地需要进行(微调)并添加额外的模型组件,以显式地生成(边界框)或(分割掩码)。然而,我们发现在(冻结状态的 LVLM)中,有极少数的(注意力头)展现出了强大

#语言模型#人工智能
到底了