logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

又又又史上最强?OpenAI的草莓:OpenAI-o1,推理更难的科学、编码和数学模型

“OpenAI的o1模型的发布带来了超凡的推理能力,但它在实际使用中表现如何?从一个用户角度出发,我们来看看“草莓” o1的实际应用效果。看看它不同推理任务中的表现,包括语言理解、问题解答等,实现原理等等。”01—简介网上传了很久OpenAI的代号为“草莓”????的新模型,今天终于在正式官网发布了o1 系列模型,包括 o1-preview 和 o1-mini。‍‍‍‍‍‍‍‍‍“训练这些模型花更

#人工智能#深度学习
大模型微调技巧 | 高质量指令数据筛选方法-MoDS

写在前面大家好,我是刘聪NLP。大模型时代,指令微调已经成了算法工程师们必不可少的技能。而在指令微调过程中,我们往往会从数据数量和数据质量两个维度来对模型进行调优。之前写过一篇《从大量可用数据集中自动识别高质量数据》的文章,今天给大家带来一个新的方法-MoDS,一种面向模型的指令数据选择方法-《MoDS: Model-oriented Data Selection for Instruction

大模型国产化适配2-基于昇腾910使用ChatGLM-6B进行模型推理

【点击】加入大模型技术交流群随着 ChatGPT 的现象级走红,引领了AI大模型时代的变革,从而导致 AI 算力日益紧缺。与此同时,中美贸易战以及美国对华进行AI芯片相关的制裁导致 AI 算力的国产化适配势在必行。之前对华为昇腾AI软硬件平台进行过相应的介绍,本文将讲述针对ChatGLM-6B大模型在昇腾910加速卡上面进行模型推理,具体代码放置在GitHub:https://github.com

Manus 是大模型 AI Agent + MCP, 那什么是模型上下文协议 (MCP)?

它是AI和工具沟通的“新基础”,给AI提供了一个统一、标准的方法,让AI能灵活地连接外部的数据和工具。比如下面的问题,大模型 Claude 一开始是不知道数据库中的表结构的,因此先发送请求分别确定 orders 表和 users 表中相应的字段,然后再对两张表进行 join 查询。简单说,MCP就像是AI的"大脑中枢",帮助它协调各种能力,让原本只会单打独斗的模型变成了能处理复杂任务的协作团队。M

#人工智能
真香!智谱大模型,有了首个免费的API

机器之心报道机器之心编辑部大模型API,正式进入Flash时代。最近一段时间,国内外的大模型行业卷的是「快速版」。5 月谷歌 I/O 大会上,新发布的 Gemini 1.5 大模型序列中出现了 Flash 版,主打轻量化和响应速度。到 7 月,OpenAI 又在 GPT-4o 的基础上推出了 Mini 版,号称比当前最为先进的小模型能力更强,价格更低。如果你现在访问 ChatGPT,会发现原来的默

#人工智能
通义千问-Qwen技术报告细节分享

写在前面大家好,我是刘聪NLP。阿里在很早前就开源了Qwen-7B模型,但不知道为什么又下架了。就在昨天阿里又开源了Qwen-14B模型(原来的7B模型也放出来了),同时还放出了Qwen的技术报告内容。今天特此来给大家分享一下。PS:现在国内的开源大模型也开始陆陆续续的放出了技术报告,都给我卷起来!!!Report:https://qianwen-res.oss-cn-beijing.aliyu.

更胜ReACT一筹,让大模型在解决问题中学会“触类旁通”的开创性的经验学习ExpeL策略ExpeL...

“ExpeL代理是一个自主学习的人工智能代理,可以从经验中学习,是实现人类智能代理的一步。”01—之前的一篇文章介绍过一种称为ReAct的思想,它将推理(Reson)和行动(Acting)相结合,来处理多种语言推理和决策任务。详见《REACT:在语言模型中协同推理与行动,使其能够解决各种语言推理和决策任务。》‍‍‍‍‍‍‍‍今天向朋友们介绍一种更好的代理方案,该方案在ReAct基础上,增加了经验.

#学习
大模型分布式训练并行技术(三)-流水线并行

【点击】加入大模型技术交流群近年来,随着Transformer、MOE 架构的提出,使得深度学习模型轻松突破上万亿规模参数,传统的单机单卡模式已经无法满足超大模型进行训练的要求。因此,我们需要基于单机多卡、甚至是多机多卡进行分布式大模型的训练。而利用AI集群,使深度学习算法更好地从大量数据中高效地训练出性能优良的大模型是分布式机器学习的首要目标。为了实现该目标,一般需要根据硬件资源与数据/模型规模

#分布式
大模型微调技巧 | 高质量指令数据筛选方法-MoDS

写在前面大家好,我是刘聪NLP。大模型时代,指令微调已经成了算法工程师们必不可少的技能。而在指令微调过程中,我们往往会从数据数量和数据质量两个维度来对模型进行调优。之前写过一篇《从大量可用数据集中自动识别高质量数据》的文章,今天给大家带来一个新的方法-MoDS,一种面向模型的指令数据选择方法-《MoDS: Model-oriented Data Selection for Instruction

如何从数据集中自动识别高质量的指令数据-IFD指标的使用

写在前面大家好,我叫刘聪NLP。大模型时代,指令微调已经成了算法工程师们必不可少的技能。而在指令微调过程中,我们往往会从数据数量和数据质量两个维度来对模型进行优化。LIMA模型的研究发现数量有限的人工整理的高质量数据也可以提高模型的指令遵循能力。那么是否可以通过自动的方式来发现高质量数据呢?今天给大家带来一篇大量可用数据集中自动识别高质量数据的文章-《From Quantity to Qualit

#人工智能
    共 149 条
  • 1
  • 2
  • 3
  • 15
  • 请选择