logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Google最新开源大语言模型:Gemma 2介绍及其微调(上篇)

2024年6月27日,Google DeepMind发布了Gemma 2,这是Gemma系列轻量级开放语言模型的最新成员。Gemma 2在架构和训练方法上都有重大创新,在多项基准测试中取得了显著进步,甚至可以与参数规模大2-3倍的模型相媲美。本文将对Gemma 2技术报告的主要内容进行解读,包括模型架构、预训练和后训练方法、性能评估等方面。

文章图片
#人工智能
端侧多模态|谷歌开源Gemma 3n 赋能移动终端全模态智能

Gemma 3n现已在最常用的开源库中全面可用,包括transformers & timm、MLX、llama.cpp(仅限文本输入)、transformers.js、ollama以及Google AI Edge等。此次发布包含了两种模型尺寸,每种尺寸都有基础版(base)和指令跟随版(instruct)两种变体。这些模型的命名遵循非标准约定,分别为和,其中的“E”代表“Effective”(有效

#人工智能
论文推荐 |【Agent】自动化Agent设计系统

• 引入了自动化代理系统设计(ADAS),这是一个新的研究领域,用于自动创建强大的代理系统设计。- 在领域迁移后,GSM-Hard任务的准确率提高了13.2%• 以代码形式表示代理,使元代理能够编程出越来越优秀的代理。- 在领域迁移后,GSM8K任务的准确率提高了25.9%自动化代理设计在性能和通用性方面显著超越了手动方法。• 在数学任务(MGSM)上将准确率提高了14.4%- 基于不断演进的先前

文章图片
#自动化#人工智能
Google最新开源大语言模型:Gemma 2介绍及其微调(上篇)

2024年6月27日,Google DeepMind发布了Gemma 2,这是Gemma系列轻量级开放语言模型的最新成员。Gemma 2在架构和训练方法上都有重大创新,在多项基准测试中取得了显著进步,甚至可以与参数规模大2-3倍的模型相媲美。本文将对Gemma 2技术报告的主要内容进行解读,包括模型架构、预训练和后训练方法、性能评估等方面。

文章图片
#人工智能
Rasa教程系列-1-命令行交互

文章目录0. 背景1. 命令行速查表2. 训练模型3. 交互式学习4. Talk to Assistant5. 启动Rasa Server6. 启动 Action Server7. Stories的可视化8. 用test数据对模型进行评估9. 划分Train-test数据集10. Markdown和JSON数据格式之间的转换11. 启动Rasa X0. 背景本文主要介绍Rasa中常用的命令行交..

突发!Meta重磅发布Movie Gen入局视频生成赛道!

作为最先进和沉浸式的讲故事模型套件,Movie Gen具备四种核心功能:视频生成、个性化视频生成、精确视频编辑和音频生成。这些模型的训练采用了经过授权和公开可用的数据集组合。虽然研究论文中详细阐述了技术细节,但本篇博文将重点分享每种功能的出色表现。后续会补充该论文的技术细节,感兴趣的小伙伴可以留意下。

文章图片
#音视频#视频生成#AI
LLM系列 | 14: 构建端到端智能客服

漠漠水田飞白鹭,阴阴夏木啭黄鹂。小伙伴们好,我是微信公众号《》的小编:卖海蛎煎的小男孩。今天这篇小作文是吴恩达《Building Systems with the ChatGPT API》课程的第3篇笔记。本文将综合之前多篇文章搭建一个带评估功能的。完整代码请在微信公众号:「小窗幽记机器学习」上添加小编微信。

文章图片
#人工智能
Agent系列:多模态智能体AppAgent v2助力AI手机(简化版)

AppAgent v2 通过灵活的动作空间设计、结构化知识库和强大的探索与部署机制,显著提升了智能体在移动设备上的交互能力和任务执行效率。实验验证了该框架在复杂移动应用场景中的卓越表现,并展示了其在未来智能体研究中的巨大潜力。

文章图片
#人工智能
部署大模型需要多少GPU显存?以DeepSeek R1部署为例

部署大型语言模型(LLM)时究竟需要多少GPU显存?本文将进行一次简单测算。

#人工智能#DeepSeek
端侧多模态 | “袖珍战神“SmolVLM技术报告深度解读

SmolVLM是一系列为资源受限环境设计的紧凑型多模态模型,其核心在于通过创新的架构设计、高效的token化策略和优化的数据管理,实现了在极低计算成本下的卓越性能。研究者们系统地探索了影响小型视觉语言模型效率和能力的多个因素,包括编码器与语言模型的参数分配、上下文长度、视觉token压缩以及针对图像和视频数据的特定处理方法。实验结果表明,SmolVLM在多个视觉语言理解和视频理解基准测试中表现出色

#人工智能#算法
    共 129 条
  • 1
  • 2
  • 3
  • 13
  • 请选择