logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

开源AI模型≠免费API?别再误会了!揭秘模型开源的那些事儿

AI领域的“开源”通常指开放模型权重(Open Weights),让你能用训练好的模型,但不一定给你完整的训练源码和数据。允许本地部署、研究和微调,促进了AI生态的繁荣。使用别人提供的API服务,本质上是在为昂贵的计算资源和维护服务付费,与模型本身的开源许可协议是两码事。Token计费是衡量计算消耗的一种方式。给开发者和AI爱好者的建议:你是想在本地运行、微调模型进行深度定制,还是只需要便捷地调用

文章图片
#开源#人工智能#深度学习 +1
深度解析Qwen3:性能实测对标Gemini 2.5 Pro?开源大模型新标杆的部署挑战与机遇

大语言模型(LLM)的浪潮持续席卷技术圈,性能天花板不断被刷新。以 Gemini 2.5 Pro 为代表的闭源模型展现了惊人的能力,但其高昂的成本和有限的可访问性也让许多开发者望而却步。与此同时,开源力量正以前所未有的速度崛起。近期,阿里巴巴发布的 Qwen3 系列模型,尤其是旗舰级的 Qwen3-235B,在各大基准测试中取得了令人瞩目的成绩,部分指标甚至直逼闭源顶流,引发了业界的广泛关注。Qw

文章图片
#开源#人工智能#深度学习 +1
3.9 图像分类领域经典模型-VGG(百度架构师手把手带你零基础实践深度学习原版笔记系列)

3.9图像分类领域经典模型-AlexNet(百度架构师手把手带你零基础实践深度学习原版笔记系列)VGGVGG是当前最流行的CNN模型之一,2014年由Simonyan和Zisserman提出,其命名来源于论文作者所在的实验室Visual Geometry Group。AlexNet模型通过构造多层网络,取得了较好的效果,但是并没有给出深度神经网络设计的方向。VGG通过使用一系列大小为3x3的小尺寸

#神经网络#深度学习
破解深度学习难题:Batch Normalization 如何解决 Internal Covariate Shift (内部协变量偏移)问题

Internal Covariate Shift(内部协变量偏移)是指在深度神经网络训练过程中,由于前一层参数的更新导致后一层输入数据分布发生变化的问题。简单来说,随着模型的训练,网络的每一层都会接收到“不断变化的输入分布”,这会给训练过程带来挑战。

文章图片
#深度学习#batch#人工智能
python机器学习中random.shuffle奇技淫巧

python机器学习中random.shuffle奇技淫巧  random.shuffle()基础用法random.shuffle(list) 用来打乱这个list的顺序如图  在机器学习中的妙用玩过机器学习的大佬都知道数据集的珍贵性,我们对于训练集顺序不影响训练输出的情况,会有一个需求–打乱训练集反复使用,以榨干训练集的完整价值o(´^`)orandom.

#python#机器学习
三种注意力机制: 多头注意力、分组多查询与多查询注意力(Multi-Head , Grouped Multi-Query , Multi-Query ):图书馆类比解读三种注意力机制的区别与优劣

用一个简单的生活场景来类比,帮助你理解图中的三种注意力机制(Multi-Head Attention, Grouped Multi-Query Attention, Multi-Query Attention)的区别。这就像在图书馆里,通过分组解决了成本高和效率低的问题,同时保留了较好的个性化服务。分组注意力机制在计算效率和结果质量之间找到了一个平衡点。多头注意力模型提供高质量的输出,但代价是计算

文章图片
#深度学习#人工智能
破解深度学习难题:Batch Normalization 如何解决 Internal Covariate Shift (内部协变量偏移)问题

Internal Covariate Shift(内部协变量偏移)是指在深度神经网络训练过程中,由于前一层参数的更新导致后一层输入数据分布发生变化的问题。简单来说,随着模型的训练,网络的每一层都会接收到“不断变化的输入分布”,这会给训练过程带来挑战。

文章图片
#深度学习#batch#人工智能
【AI Agent开发必读】搞懂Memory、向量库、Agent、Workflow,告别概念迷茫!收藏这篇就够了!

理解 Memory、Vector Store、Storage、Agent 和 Workflow 这五个核心概念及其区别,对于设计和开发强大的 AIGC 应用至关重要。它们就像搭建 AI 大厦的不同砖瓦和工具,各有其位,互相配合。希望这篇博客能帮助你理清思路,告别概念迷茫。如果你觉得有用,!也欢迎在评论区留下你的疑问或见解,我们一起交流,共同进步!本文基于个人理解和公开信息撰写,旨在科普交流,如有不

文章图片
#人工智能#深度学习#ubuntu
【爆款预定】五一长假+Qwen3发布=AI效率巅峰?告别瞎指挥,大模型实用指南助你假期躺赢!

信息过载,需要整理和提炼?智慧玩法:想学新东西?“我想趁五一学习 Python 数据可视化,请推荐一些优质的在线教程(免费优先)、必看书籍、核心库以及实战项目资源?”—— AI 帮你高效筛选和聚合信息。快速回顾长篇内容?“把这篇XX文章/会议纪要(粘贴内容)的核心观点总结成 3 点,每点不超过 50 字。”——节省信息处理时间。策划活动没头绪?“五一部门想搞个线上互动,帮我头脑风暴几个主题,并列出

文章图片
#人工智能#开源#旅游
【开发者福利?】Google One 学生优惠验证流程疑似Bug,或可免门槛试用 Gemini 2.5 Pro

Google 为美国地区的学生提供了相当有吸引力的 Google One 订阅优惠,通常包含18个月的高级会员服务。此服务目前集成了 Gemini Advanced,用户可以借此体验到最新的 Gemini 2.5 Pro 模型。近日,有用户发现其验证流程似乎存在一个“缺口”:在特定操作下,系统可能不会强制要求提供传统的.edu教育邮箱进行验证,也无需绑定信用卡信息即可完成订阅。甚至一些以前可能不被

文章图片
#bug#人工智能#深度学习 +2
    共 17 条
  • 1
  • 2
  • 请选择