logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【AI论文】10亿参数大语言模型能超越405亿参数大语言模型吗?重新思考测试时计算最优缩放

TTS方法主要分为两大类:内部TTS和外部TTS。内部TTS通过训练LLMs以“慢速”思考的方式生成长链式思维(Chain-of-Thought,CoT),从而提高推理能力。而外部TTS则通过采样或基于搜索的方法,在固定LLMs的基础上提高推理性能。外部TTS的关键挑战在于如何最优地分配计算资源,即为每个问题分配最佳的计算量。在外部TTS中,过程奖励模型(PRMs)起着至关重要的作用。PRMs通过

文章图片
#人工智能#语言模型#自然语言处理
【AI论文】硬测试:为大型语言模型(LLM)编程合成高质量测试用例

本文提出HARDTESTGEN测试用例合成管道及HARDTESTS数据集(含47k编程问题),用于提升大语言模型(LLM)代码验证能力。实验表明,该方案评估代码时精确度提升11.3%、召回率提升17.5%,在困难问题上精度提升可达40%。研究还验证了高质量测试用例对模型训练的显著优化效果。工作为LLM代码生成任务提供了有效的验证工具和训练资源。

文章图片
#人工智能#语言模型#自然语言处理
模型蒸馏技术简介

模型蒸馏是一种模型压缩技术,旨在通过让一个大模型(教师模型)指导一个小模型(学生模型)的训练,使得小模型在保持性能的同时降低计算成本。

文章图片
#机器学习#人工智能#python
私有化大模型部署:部署OpenWebUI+Ollama笔记

7. 安装的时间有点长了,细节有点记不清楚,当时遇到过在本地的open webui网站里选择不到之前安装的llama 8B的问题,问题出在ollama运行的端口和open webui运行的端口中之间的通信问题,记得可以访问8080端口来观察ollama运行的问题,后来应该是在哪里修改了ollama的端口解决了问题。1. 这次选择了Azure国际云,最开始用阿里云,但是通过阿里云下载llama3.1

【AI论文】Paper2Code:从机器学习科学论文中自动化代码生成

PaperCoder是一个多代理LLM框架,用于将机器学习论文转化为功能代码库。该框架分为三个阶段:规划、分析和生成。每个阶段都通过一组专门设计的代理进行实例化,这些代理旨在在整个管道中有效地协作。规划阶段:该阶段负责构建高级路线图,设计系统架构,识别文件依赖关系,并生成配置文件。具体来说,规划代理会读取论文内容,提取关键信息,如数据集、模型架构、实验设置等,并基于这些信息生成系统的整体设计。通过

文章图片
#人工智能#自动化#运维
【TOGAF系列】架构开发方法(ADM)第一章

TOGAF ADM描述了一种开发和管理企业架构生命周期的方法,并构成了TOGAF标准的核心。它集成了TOGAF标准的元素以及其他可用的架构资产,以满足组织的业务需求。1.1.1 ADM、企业连续体和架构存储库企业连续体提供了一个框架和上下文,以支持在执行ADM时利用相关架构资产。这些资产可能包括来自各种来源的架构描述、模型和模式,如TOGAF标准——架构内容中所述。企业连续体对架构源材料进行分类,

文章图片
#架构
【AI论文】Paper2Code:从机器学习科学论文中自动化代码生成

PaperCoder是一个多代理LLM框架,用于将机器学习论文转化为功能代码库。该框架分为三个阶段:规划、分析和生成。每个阶段都通过一组专门设计的代理进行实例化,这些代理旨在在整个管道中有效地协作。规划阶段:该阶段负责构建高级路线图,设计系统架构,识别文件依赖关系,并生成配置文件。具体来说,规划代理会读取论文内容,提取关键信息,如数据集、模型架构、实验设置等,并基于这些信息生成系统的整体设计。通过

文章图片
#人工智能#自动化#运维
【AI论文】Cosmos World基础模型平台用于物理人工智能”

英伟达公司在CES发布新品的同时也发了了相应的Cosmos World基础模型平台的论文。Cosmos World基础模型平台是英伟达推出的生成式世界基础模型平台,旨在解决物理人工智能(Physical AI)训练数据获取难的问题,推动其发展。该平台集成了生成式世界基础模型、高级标记器和加速视频处理管道,能够帮助开发者生成大量基于物理的合成数据,减少对真实世界数据的依赖这篇论文介绍了 NVIDIA

文章图片
#人工智能
如何通过大语言模型将PDF文稿转化为播客

这种主要以双人对话形式的音频节目包含的信息量丰富,涉及的话题广泛,弥补了既有内容形式的许多不足,我很喜欢使用的就有一个叫“小宇宙”的APP,“42章经”、“高能量”都是很不错的播客。抛开项目各种细小琐碎的代理处理逻辑,这个项目最值得留意的是能够将很大量的Prompts通过指定Schema后如编程一样很结构的联动起来生成需要的内容。8. 紧接着的部分有点意思,将之前的大纲、前一个步骤生成的对话脚本以

文章图片
#语言模型#人工智能
【AI论文】大语言模型智能体:方法论、应用与挑战综述

智能代理的时代已经来临,这得益于大语言模型领域的革命性进展。大语言模型(LLM)代理具备目标驱动的行为和动态适应能力,有望成为通向人工通用智能的关键路径。本综述通过以方法论为中心的分类体系,系统地剖析了大语言模型代理系统,将架构基础、协作机制与演化路径相联系。我们揭示了代理设计原则与其在复杂环境中涌现行为之间的基本联系,从而整合了分散的研究线索。我们的工作提供了一个统一的架构视角,审视了代理的构建

文章图片
#人工智能#语言模型#自然语言处理
    共 450 条
  • 1
  • 2
  • 3
  • 45
  • 请选择