logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

图解大模型训练系列:序列并行1,Megatron SP

不做任何并行处理时,单卡上attn+mlp层的激活值大小假设有t块卡,纯tp处理时,单卡上attn+mlp层的激活值大小,这里唯一没有被t除的10表示attn和mlp中和layernorm输入、输出以及最后一个dropout mask相关的部分。这一部分也是sp关注的优化点。假设有t块卡,做tp+sp处理时,单卡上attn+mlp层的激活值大小为。

文章图片
#人工智能#AIGC#算法 +2
一文彻底搞懂大模型 - OpenAI o1(最强推理模型)

而o1在每个问题上使用一个样本平均解决了74%(11.1/15)的问题,使用64个样本的共识解决了83%(12.5/15)的问题,并使用学习到的评分函数对1000个样本进行重新排序后解决了93%(13.9/15)的问题。在其他一些机器学习基准测试中,o1也超过了最先进的模型。OpenAI 从GPT3开始转向闭源,很多技术细节都没有公布,OpenAI o1这次也不例外,网上很多人反馈想通过使用o1一

文章图片
#AIGC#算法#自然语言处理 +2
手把手教你基于Ollama+FastGPT+Deepseek,打造个人知识库!

最近春招和实习已开启了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。。本文从零实现,基于Ollama、FastGPT、Deepseek在本地环境中打造属于自己的专业知识库,与大家分享~

文章图片
#面试#人工智能#自然语言处理
大模型 DeepSeek-r1 本地部署如何开启联网搜索?

Page Assist 是一款开源浏览器扩展,旨在为您的本地 AI 模型提供侧边栏和 Web UI。通过它,您可以从任何网页与您的模型进行互动。当前功能: - 用于各种任务的侧边栏 - 支持视觉模型 - 本地 AI 模型的极简 Web UI - 互联网搜索 - 在侧边栏上使用 PDF 聊天 - 与文档聊天(pdf、csv、txt、md、docx)二、安装方法Chrome 谷歌浏览器在线方法直接打开

文章图片
#人工智能#深度学习#算法
GraphRAG+Ollama,构建本地精准全局问答系统!

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。RAG 是目前大语言模型相关最知名的工具之一,从外部知识库中检索事实,以便为大型语言模型 (LLM) 提供最准确、最新的信息。但 RAG 并不完美,在更好

文章图片
#算法#自然语言处理#人工智能 +1
米哈游大模型算法岗,竞争真的太激烈了!

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对大模型技术趋势、算法项目落地经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。不得不说,米哈游真的是大热门,面试真的好多好多人,竞争真的好激烈!还好我提前看了一些面试高频问题和面经分享,成功拿下了梦想中的 offer!今天和大家分享一下最近常被问到的面试题,

文章图片
#算法#AIGC#深度学习 +2
AIGC 大模型实践总结

积极拥抱变化,拒绝无谓焦虑。AI技术发展更多地是对人类能力的补充而非替代,更多作为“助理”的效果。在人工智能飞速发展的今天,我们正站在这个时代的十字路口,AI的进步为我们揭开了技术创新的新篇章,提供了前所未有的便利和机遇;另一方面,技术的飞跃发展也带来人们对未来工作和生活方式的不确定性,引发了人们心中的焦虑和恐惧。前总理:“中国有6亿人月收入不到1千”。最广大的用户可能并没有感受到GPT的日新月异

文章图片
#AIGC#算法#自然语言处理 +2
一文彻底搞懂大模型 - 基准测试(Benchmark)

最近这一两周看到不少互联网公司都已经开始秋招提前批面试了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。LLM(Large Language Model,大型语言模型)中的Benchmark(基准测试)是用于衡量和比较不同LLM性能的一组经过精心设计的测

文章图片
#自然语言处理#bert#人工智能 +1
使用 Ollama 部署本地 LLM:构建AI REST API的简易指南

最近这一两周看到不少互联网公司都已经开始秋招提前批面试了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。利用Ollama本地LLM(大语言模型)搭建AI的REST API服务是一个实用的方法。下面是一个简单的工作流程。

文章图片
#人工智能#深度学习#自然语言处理 +1
单卡4090微调大模型 DeepSeek-R1-32B

上篇文章的微调结果并不好,因为设置了max_steps=60 限制了只执行60步以便快速完成实验。之前文章同样的方法,也可以在 24G 显存的单卡 4090 上微调训练 deepseek-ai/DeepSeek-R1-Distill-Qwen-32B;即使该模型的权重文件大小已经达到 62G,这是因为 unsloth 和 lora 的量化微调和部分参数微调优化可以大幅节约显存占用。最近,我们又陆续

文章图片
#算法#transformer#深度学习
    共 93 条
  • 1
  • 2
  • 3
  • 10
  • 请选择