logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【2025版】大模型需要怎样的硬件算力,从零基础到精通,精通收藏这篇就够了!

背景2017年,《Attention Is All You Need》的一声惊雷,给世人带来了Transformer模型。2022年,以Transformer结构为核心的chatGPT,凭借其震惊世界的表现,掀起了“AI元年" 的序幕:从此,各方纷纷投入大模型领域,前赴后继,热情高涨。然而,随之而来地,大模型在软硬件基础设施、算法及数据集等多方面的挑战和困难也逐步显现;今天我们将从AI-Infra

文章图片
#人工智能#网络
AI 浪潮下,人工智能为世界青年就业带来哪些机遇和挑战(非常详细)从零基础入门到精通,收藏这篇就够了

各位网络安全冲浪选手们,最近 AI 的风刮得那叫一个猛烈!这玩意儿不仅能帮你写代码、debug,甚至还能帮你防御攻击,简直是安全从业者的“好帮手”!但是,问题也来了,AI 这么厉害,会不会把咱们的饭碗给抢了?别慌,今天就来跟大家聊聊,!话说现在 AI 发展速度,那是坐火箭的速度!经合组织(OECD)都说了,AI 算力算法那是杠杠的,直奔通用智能去了!不仅如此,像微软、谷歌这些科技巨头,也在拼命升级

文章图片
#人工智能
【2025】国内人工智能大模型汇总,从零基础到精通,精通收藏这篇就够了!

作为360鸿图大模型的重要组成,智脑模型拥有多项核心功能,包括多模态理解、多语言处理、知识问答、逻辑推理、多轮对话等。九天人工智能平台提供人工智能算力、算法、数据,汇聚优秀AI能力,打造从智算基础设施、核心算法能力到智能化应用的全栈人工智能服务,全面支持自智网络等多样化运营商智慧运营需求,为工业、医疗、政务、教育、金融等行业客户构建创新解决方案。此外,360智脑模型还积极与各行业合作伙伴共同打造行

文章图片
#人工智能#网络#开发语言 +3
关于大模型微调与训练的问题,大模型训练的难点在哪里?零基础入门到精通,收藏这篇就够了

大模型训练的难点不在于大模型本身,而在于训练数据这两天公众号上有一个小兄弟问我关于大模型训练的问题,然后他想自己训练一个小模型,但又不知道该怎么操作;所以,今天就再来讨论一下大模型的训练问题,大模型训练的难点到底在哪里?大模型训练的难点对大部分学习大模型技术的人来说,大模型训练和微调可能都是一个无法绕过的问题,也是很多人弄不明白的问题,总认为由于没有足够的算力,个人无法进行模型训练。但事实上有这种

文章图片
#语言模型
最新大模型训练微调需要什么样的硬件配置,(非常详细)零基础入门到精通,收藏这篇就够了

==NVIDIA GPU架构的演进过程从V100,到RTX5000,到A100/A800(800为中国合规特供),到H100/H800(800为中国合规特供)如下图所示:目前针对大模型主要使用A800,A100,H100,性能对比如下为了合规对 A100 和 H100 的参数做了微调,A800 相对比 A100 ,限制了GPU之间的互联带宽从A100的600GB/s 降至400GB/s,算力参数无

文章图片
#网络#运维
解剖小龙虾 — AI Agent 的运作原理

技能是预定义的任务流程,类似于“子程序”。例如:制作教学影片的完整流程参加比赛的报名流程发布社交媒体内容的流程OpenClaw(本地程序)接收用户输入管理 System Prompt维护对话历史执行工具调用管理记忆文件语言模型(云端或本地)接收完整的 prompt进行文字接龙返回回应或工具调用指令工具集read/write:文件操作search:网络搜索图像生成、语音合成等专业工具浏览器控制、应用

#人工智能#spring#算法
面试官:“RAG 不就是调一下 API 吗?”,我怼回去:“20万字全塞进 Prompt,你确定?”

RAG (Retrieval-Augmented Generation,检索增强生成)是一种将强大的信息检索 (Information Retrieval, IR)技术与生成式大语言模型 (LLM)相结合的框架。RAG 的核心思想是:在让 LLM 回答问题或生成文本之前,先从一个大规模的知识库(如数据库、文档集合)中检索出相关的上下文信息,然后将这些信息与原始问题一并提供给 LLM,从而“增强”其

文章图片
#网络协议#网络#java
面试官:“Agent 不就是 LLM 加点工具?”,我:“ReAct、Reflection、A2A、Agentic Workflows……”

ReAct(Reasoning + Acting)是当前 AI Agent 理论中最具基础性和代表性的范式,由 Shunyu Yao、Jeffrey Zhao 等大佬于 2022 年在论文《ReAct: Synergizing Reasoning and Acting in Language Models》中提出。该范式已成为现代 AI 代理设计的基准,影响了后续框架如 LangChain 和 L

文章图片
#react.js#前端#前端框架
面试官:“Agent 不就是 LLM 加点工具?”,我:“ReAct、Reflection、A2A、Agentic Workflows……”

ReAct(Reasoning + Acting)是当前 AI Agent 理论中最具基础性和代表性的范式,由 Shunyu Yao、Jeffrey Zhao 等大佬于 2022 年在论文《ReAct: Synergizing Reasoning and Acting in Language Models》中提出。该范式已成为现代 AI 代理设计的基准,影响了后续框架如 LangChain 和 L

文章图片
#react.js#前端#前端框架
面试官:“你这么厉害咋不手撸个Claude Code?” 我笑着说:“就这!”

为什么推荐这个网站?渐进式学习:从 84 行到 694 行,每一步都清晰可见。问题驱动:先戳痛点再给解药,让你明白为什么需要这个机制。可视化强:任务看板、进度条、状态流转,抽象概念具象化。代码透明:每课改动列得明明白白,拒绝黑箱。即刻上手:命令和测试用例直接给,看完就能跑。原理通用:Python 示例但思想语言无关,Java/Go/TS 都能复刻。学完这 12 课,你能理解 Claude Code

文章图片
#人工智能#python#开发语言
    共 1029 条
  • 1
  • 2
  • 3
  • 103
  • 请选择