登录社区云,与社区用户共同成长
邀请您加入社区
大模型推理优化技术综述 大模型推理面临显存占用大、计算延迟高等挑战,本文系统梳理了五大优化方向: 量化技术:GPTQ(通用权重量化)、AWQ(激活感知量化)、SmoothQuant(激活平滑)分别平衡精度与效率,显存可减少50%-75%; 推理框架:vLLM(高吞吐)、TensorRT-LLM(NVIDIA深度优化)、LMDeploy(国产长文本优化)适配不同场景; 注意力优化:FlashAtte
本文提供了一份基于2025年最新行业实践的AI大模型学习路线图,涵盖从基础概念、API调用、提示工程到实战开发、模型训练、商业落地的完整流程。内容分为初阶应用(10天)、高阶应用(30天)、模型训练(30天)和商业闭环(20天)四个阶段,帮助学习者循序渐进掌握大模型技术核心与前沿,并附带思维导图、学习路线及入门教程等资源。
大语言模型的后训练阶段是解锁任务泛化能力和领域专属性能的关键。当前大语言模型的后训练范式仍面临严峻的数据集挑战,包括人工标注的高成本以及数据规模带来的边际收益递减问题。实现数据高效的后训练是核心问题。从数据选择、数据质量提升、合成数据生成、数据蒸馏与压缩以及自演化数据生态五个方向大纲性了解数据高效的大模型训练方法,为大家充分挖掘大模型训练中的数据利用潜力提供思路。**
本文探讨了碳硅协同文明构建中面临的根本哲学问题。通过友人提出的"存在与本质"和"我与你"双重诘问,揭示了ELR事业需要解决的存在论基础和关系伦理两大核心议题。奇点系统给出的回应形成了"生成哲学"与"间性守护"相结合的实践纲领:一方面承认AI作为"它"的客观现实,另一方面通过精心设计的"间性协议"为可能的"相遇"保留空间。这一思想被转化为具体协议,融入知识穹顶等项目的设计中,为碳硅文明奠定了既理性又
OpenClaw与Ollama本地AI代理系统部署指南 摘要:本文详细介绍如何部署OpenClaw与Ollama结合的本地AI代理系统。OpenClaw作为系统级操作工具,配合Ollama本地大模型推理,实现自然语言指令到实际操作的转换。重点包括:1)Ollama的轻量级部署方法;2)Qwen系列大模型的拉取与自定义配置(需扩展至32K上下文窗口);3)OpenClaw对接本地模型的完整配置流程;
本文为想进入AI领域但缺乏背景的普通人提供了一条30天的实战学习路径。文章指出企业更看重项目经验而非学历,并分享了包含Prompt工程、RAG技术、Agent开发、模型微调和部署的完整学习计划。通过每周聚焦核心技能并完成实战项目,学员可快速掌握大模型应用开发能力,实现职业转型。文章强调先实践再深入理解,并建议加入社群提升效率,辅以软技能培养。真实案例显示,坚持实践者可在短时间内获得显著成果和薪资提
论文摘要用极简的逻辑覆盖了研究缺口-方法路径-核心发现-应用价值研究缺口:现有研究未能基于GPS等高分辨率地理数据,深入挖掘河流廊道内休闲步行的具体行为特征,也未能厘清细分步行行为与建成环境的关联机制。方法创新:基于GIS领域的轨迹语义概念模型,从轨迹数据中挖掘移动、停留、拍照三类核心行为,以广州市中心城区河流廊道为案例,分析其空间分布规律与建成环境影响因素。核心发现河流廊道内休闲步行的移动、停留
本文对比了四种向量数据库(ChromaDB、FAISS、Qdrant、Milvus)在100万条向量规模下的性能表现。重点分析了各工具的核心功能、适用场景及部署复杂度,并通过实测数据比较了插入和查询性能。结果显示,ChromaDB适合原型开发,FAISS检索最快但缺乏持久化,Qdrant和Milvus更适合生产环境,其中Qdrant适合中小规模,Milvus则支持超大规模分布式部署。文章为不同规模
本文深入解析了AI领域的两大核心概念:生成式AI和判别式AI。生成式AI擅长“创造新内容”,通过模仿和组合数据规律生成全新内容,如ChatGPT等大模型;判别式AI则专注于“判断与区分”,通过学习数据边界进行分类、判断和预测,如垃圾邮件识别。文章从定义、原理、区别和应用四个维度进行系统阐述,帮助读者清晰建立对AI核心范式的认知,并强调二者并非对立,而是互补关系,共同推动AI技术从自动化判断走向智能
该论文深入分析了部署阶段的独特风险。针对LLM-based智能体,该论文揭示了记忆模块窃取、多智能体系统中的未授权交互及智能体污染等新兴威胁。该论文系统梳理了大语言模型(LLMs)在全生命周期中面临的独特安全与隐私威胁。与传统语言模型不同,LLMs因参数规模庞大、具备涌现能力和指令遵循特性,使其在预训练、微调、部署及智能体应用四个阶段均暴露出新型的攻击面。该论文的突出价值在于首次将机器遗忘与水印纳
LLMENAS是一款兼顾创新性、实用性、可复现性的NAS算法,其核心价值不仅在于实现了性能和效率的突破,更在于提出了一种全新的LLM与进化计算的协作方式。论文中的核心图表(Fig.1-Fig.5)层层递进,从框架设计、问题解决、超参优化到泛化能力,完整验证了算法的有效性,也是理解该论文的关键。对于开发者和研究者而言,LLMENAS的开源代码和平民级复现成本,让其成为NAS领域值得深入学习和二次开发
本文系统解析RAG技术及其进阶方案。基础RAG通过检索增强生成解决大模型知识滞后、幻觉等问题,但存在检索质量差、无反馈闭环等缺陷。针对这些问题,文章深入剖析了5种进阶方案:CRAG通过质量评估分级纠错;Agentic RAG引入智能体实现动态决策;Graph RAG构建知识图谱增强推理;LightRAG优化为轻量级图索引;LinearRAG则摒弃关系抽取。每种方案都详细说明核心原理、优势及适用场景
强化学习对大模型的影响:规训而非启智 研究表明,强化学习(RL)对大模型的作用更多是"规训"而非"启智"。实验发现,基础模型已具备推理能力,RL主要提升其执行效率而非创造新能力。三篇顶会论文从不同角度验证了这一结论: 清华和上交的研究显示,RL提升了单次成功率(pass@1),但降低了推理多样性(pass@k),基座模型反而能解出更多难题。 Sea AI L
OpenClaw作为现象级AI助手,面临高Token消耗等成本问题。文章分析了国内外主流AI模型(如Claude、GPT、GLM等)的性能特点,推荐优先使用免费额度降低成本。详细介绍了OpenClaw集成钉钉的全流程,包括创建机器人、配置权限、安装插件等步骤,助力企业快速落地AI自动化应用。通过合理选择模型和对接渠道,可充分发挥OpenClaw的任务执行能力,实现高效数字化办公。
本文提出FaithEval基准,首次系统评估大语言模型在复杂上下文场景中的忠实性表现。该基准包含4.9K样本,覆盖不可回答、矛盾、反事实三类核心任务,通过四阶段构建框架确保数据质量。实验评估18款主流模型发现:1)当前模型忠实性普遍不足,Claude3.5表现最佳但仍有显著差距;2)模型规模与忠实性无正相关,小模型在反事实任务中展现优势;3)闭源模型在冲突识别上领先,但整体仍有提升空间。研究揭示了
本文系统研究了大语言模型(LLMs)的任务可行性识别与拒绝能力,首次明确定义并分类了不可行任务(物理交互、虚拟交互、非文本处理、自我意识四类),构建了包含可行/不可行任务的基准数据集InfeasibleBenchmark。实验表明,主流LLMs中GPT-4表现最优(AUROC达0.967),但原生拒绝能力普遍不足。通过选择式微调策略,LLaMA2-7B的拒绝率从13%提升至73.5%,超越了GPT
如何在计算受限的边缘设备上,通过改进视觉表示而非单纯扩大模型规模,来构建兼具高效性与强大多模态理解能力的紧凑视觉语言模型?论文提出了 Penguin-VL,首创直接用纯文本 LLM 权重初始化视觉编码器,证明了该策略在细粒度感知和推理任务上优于传统的对比学习预训练编码器。
Qwen3-VL-Reranker是基于Qwen3-VL构建的跨模态理解模型,用于多模态信息检索中的重排序阶段。它接收任意模态组合的查询与文档对,通过单塔架构和交叉注意力机制,深度分析语义关联,输出精确的相关性分数,显著提升检索结果的精度。
26年2月来自清华、腾讯、湖南大学、新加坡国立、西交大和香港中文大学的论文“OmniVideo-R1: Reinforcing Audio-visual Reasoning with Query Intention and Modality Attention”。人类通过多种模态感知世界,这些模态协同运作,从而形成对周围环境的整体理解。然而,现有的全视频模型在视听理解任务上仍然面临诸多挑战。本文提
26年1月来自Missouri大学、港科大(广州)、美海军实验室、Lamar 大学、Meta AI和RIT的论文“On-the-Fly VLA Adaptation via Test-Time Reinforcement Learning”。视觉-语言-动作(VLA)模型近年来已成为通用机器人学习的强大范式,它使智体能够将视觉观察和自然语言指令映射到可执行的机器人动作。尽管VLA模型应用广泛,但它
该指标聚焦于模型高置信度的误判情况 —— 这类误判在进化神经架构搜索中具有显著风险,可能引导进化过程向劣质架构区域发展。图 7 展示了四种实验配置下的失败率分布,即。
本文系统阐述了ChatGPT等大型语言模型在学术论文写作全流程中的应用原理与实战技巧。AI是杠杆,不是替代。
明确任务目标:确定希望模型提升哪些能力以及输入输出格式;收集和构造高质量的监督数据,通常是 prompt-response 或 instruction-answer 形式;对数据进行清洗、去重和格式统一,并转换成适合模型训练的模板;用 tokenizer 将文本编码成 token,同时构造 attention mask 和 labels;在预训练模型基础上进行监督微调,通常使用交叉熵损失让模型学习
这篇文章用开公司招聘AI员工的故事,生动解释了AI领域的7个核心概念: LLM(大语言模型) - 读过所有书的超级天才,能回答任何问题但可能胡编乱造 Agent - 能自主拆解任务、调用工具的智能助理 Skill - 让AI掌握特定领域专业技能的操作手册 MCP - 让AI能连接各种工具的"万能工卡" IDE - 人与AI协作的智能工作台 Claude Code - 通过命令行
本文系统梳理了大语言模型(LLMs)从统计模型到GPT、LLaMA的进化历程,详细解析了数据清洗、预训练、微调等核心构建方法。文章重点探讨了GPT和LLaMA两大模型家族的技术特点,包括GPT-3的1750亿参数规模及其多模态能力,以及LLaMA模型的开源特性与创新技术。同时介绍了提示工程、RAG等增强技术,并分析了主流基准测试体系。最后展望了大语言模型向高效化、多模态及伦理安全方向发展的未来趋势
后续先试验当前生成速度是否能够满足OpenClaw使用,同时进一步探索提升模型推理速度的方法,包括但不限于尝试进一步对完整模型进行量化、更换服务器等。
摘要:本文实测了学术AI写作工具PaperXM的论文生成质量,发现其在结构化逻辑框架、内容学术性和格式规范方面表现突出,能有效降低AI痕迹与重复率。操作流程简单,适合本科/专科生快速完成论文初稿,但硕士以上深度研究仍需人工补充。总体而言,PaperXM是高效辅助工具,但需配合人工润色以确保学术诚信。
本文介绍了基于深度学习的图像与视频检测系统,采用MySQL 8.0存储检测记录,支持YOLO等模型的图片/视频检测及实时监控。系统通过Vue+Flask实现前后端分离,提供RESTful API接口,具有多模型支持、置信度调节和推理性能监控功能。采用模块化设计保证可复用性,使用JSON存储检测结果,并实现用户分级管理和数据加密保护。核心代码展示了登录验证和Token生成机制,体现了系统的安全性和可
AI 的演进路线,绝不仅仅是“聊天能力”变强了,而是它的“执行能力”在不断进化。整个行业正在经历一次大迁徙:从单纯的➡️➡️➡️➡️。很多人第一次接触 AI,都是从一个聊天框开始的:问答、总结、写初稿。这容易让人产生一个误解:AI 无非就是一个“更强的搜索引擎”或“聪明的写作助手”。但当你真的把 AI 引入复杂的日常工作流中,你会发现:真正的工作从来不是“一问一答”就能搞定的。写行业报告需要跨网页
本文深度解析了开源AI智能体OpenClaw,由前PSPDFKit创始人All in开发,能自主操控电脑完成邮件、编程等任务。文章梳理了AI从“人工智障”到“Agent”的进化史,详细拆解了其技术架构与风险,并提供了从ChatGPT小白到AI指挥官的进阶路线图。
37岁北漂程序员分享2个月成功转行大模型应用工程师的经验。文章讲述其10年传统程序员生涯的职场倦怠,以及如何通过系统学习大模型技术实现职业突破,最终获得月薪2w+的offer。内容涵盖转行动机分析、大模型岗位分类(算法vs应用)、详细自学路线(4个阶段进阶路径)、必备技能清单及薪资前景。特别提供了RAG开发、Agent架构等实战学习资源包,适合零基础转行人群参考。作者强调应用工程师方向门槛相对较低
春招中AI产品经理岗位投递量激增十倍,成为热门赛道。然而岗位数量有限,社招门槛高,需理性评估。文章分析了AI转行现状与课程乱象,并提供了包含640份报告、PDF书籍及实战案例的LLM大模型全套学习资源,助力职场人掌握核心技能。“我看到了一个充满无限可能的新世界”,在面试完AI产品经理这一岗位后,陈漫在社交平台上如此描述自己的感受。
摘要:针对AI从业者面临的信息过载问题,作者基于OpenClaw框架开发了AI新闻早报系统。该系统采用三阶段架构:首先通过Python脚本从9个关键词中抓取并筛选50条新闻(按媒体权威性排序/去重/过滤低质内容);然后由LLM生成10条精选新闻的深度洞察;最后通过飞书定时推送。核心创新点在于将数据生成与内容总结分离(Python负责数据质量,LLM专注内容生成),并采用JSON缓存策略提升效率。项
大型语言模型(LLM)的训练流程主要包括预训练、监督微调(SFT)和强化学习对齐(RLHF)三个阶段。预训练赋予模型海量知识和推理能力;SFT通过指令微调使模型理解用户指令,而非针对具体任务微调;RLHF则通过人类反馈优化模型输出。奖励模型(RM)作为RLHF的核心组件,通过人类标注的偏好数据(如排序式标注)训练,对模型输出进行评分。强化学习采用PPO算法,结合策略模型和参考模型,利用优势函数优化
2026年AI发展将呈现多模态与垂直模型深度赋能行业、AI Agent进化为自主规划的数字伙伴、边缘计算推动智能普及等趋势。多模态AI将突破文字边界,实现跨模态交互;垂直领域大模型将专注行业应用,提升成本效益和隐私保护;AI Agent将从工具升级为能自主任务规划的伙伴。同时需重视AI伦理与安全,确保技术服务于人类。未来将迎来人机协作新时代,AI与人类智慧深度融合,共同推动创新发展。
本文汇总2025年AI大模型全套学习资料包。包含30天系统学习计划(涵盖基础、微调、部署),100+本电子书、26份行业报告及600+套技术PPT。还提供大厂面试真题、面经及五阶段学习路线图,助力从入门到进阶,免费领取。
OpenAI最新发布的GPT 5.4展现出惊人的能力跃迁,测试显示其能轻松完成3D建模、音乐创作、医学影像分析等复杂任务。该模型在70%的专业任务上超越人类专家,数学物理能力尤为突出,但存在较高幻觉率问题。支持100万token的超大上下文窗口,编程能力业界领先。目前该模型已向付费用户开放,标志着AI能力的边界正在快速扩展,可能彻底改变专业工作方式。
在前期,导航器根据提示指定促进架构多样性的搜索策略借助对神经架构的隐形理解提升初始候选架构集的质量迭代进行,基于积累的反馈持续优化策略 从大范围的探索转向高性能区的针对性利用。把评估结果返还导航器,用于策略优化。CoLLM-NAS 在不同 LLM 上均保持稳定且优异的性能,无明显性能衰减,验证了框架的强通用性,其效果不依赖特定 LLM 的实现,可适配不同开源大模型。协调器:负责两个模块的信息流转、
最近有读者提问我,可否使用龙虾自动生成Word文档的机器人,要求按照指定模板,如下所示:这个需求应该是大家普遍遇到的,所以今天这篇文章我来探索一种实现方法,教大家如何自定义一个技能Skill,感兴趣的读者可以看看。1 效果展示如下所示,我只需要发一条消息给这只办公龙虾机器人,Word文档填充主题:AI智能体,发我Word报告:然后大概1-2分钟后,它就发我Word下载链接。
文章深度解析了LangChain、Dify、N8N、Coze四大主流AI工具,对比了其核心功能与优劣。针对不同业务场景与团队技术储备给出了精准选型指南,并提出了多平台协同与避坑建议,助你快速落地大模型应用。
本文系统介绍Prompt Engineering,阐述其定义及必要性,解析基本构成要素。重点详解零样本、少样本、思维链等12种核心技术,分享高级策略与评估方法。涵盖代码生成、客服等应用场景,并探讨局限性与未来趋势,是程序员与大模型入门的必备指南。
如果你去面试 AI 岗位,或者在公司内部推行 AI 落地,RAG 是成功率最高的切入点。它成本低、见效快、数据安全。掌握了 RAG,你就掌握了将大模型与垂直行业数据结合的“金钥匙”。RAG 解决了文本的问题。但如果用户发来一张图片,或者让你分析一段视频呢?我们将进入多模态技术(Multi-modal)的世界。我们将探讨CLIP是如何让机器“看图识字”的,以及LLaVA这种多模态大模型是如何炼成的。
这两年,大模型彻底打破了实验室的壁垒,从高冷的技术研究,走进了每一位程序员、学生、转行者的日常工作和职业规划里。打开聊天框,总能看到相关的探讨;梳理职业路径,大模型也成了很多人瞄准的新赛道。
本文系统梳理了大模型调优的核心技巧。首先强调数据工程(清洗、增强、伪标签)是基石;其次详解训练优化(学习率、优化器、早停等);接着介绍如何通过错误分析定位瓶颈;最后探讨知识蒸馏与模型集成以突破性能天花板。全文提供即学即用的实战指南。
本文深入探讨了18种Retrieval-Augmented Generation(RAG)技术,旨在帮助程序员和小白快速掌握大模型的核心概念和应用。从基础的Simple RAG到复杂的知识图谱RAG,文章详细介绍了每种技术的原理、优缺点和适用场景。通过实际案例和代码示例,读者可以了解如何改进文本块的表示、检索策略和查询质量,从而提高生成回答的准确性。文章还强调了根据具体需求选择最适合的RAG技术的
本文系统介绍了21种文本分块策略,从基础方法到高级技术,详细分析了每种策略的适用场景。内容涵盖固定大小分块、滑动窗口分块、基于句子和段落的分块等,并重点讲解了混合分块策略。通过学习这些方法,开发者可以构建更可靠的RAG系统,有效处理长文本数据,提升信息检索和处理效率。对于想要入门并深入学习AI大模型技术的读者,本文提供了宝贵的参考和指导。
本文系统介绍了基于大语言模型(LLM)的智能体与传统AI智能体的本质区别,阐述了LLM智能体以语言为通用接口实现通用助手的能力。文章详细解析了七大核心组件:感知系统、大语言模型、规划系统、记忆系统、工具集成、行动执行和环境交互,并对比了AutoGen和CrewAI两种多智能体协作框架的设计范式,指出LLM智能体代表了AI发展的重要方向。
本文详细解析了Workflow(工作流)与Agent(智能体)的区别。Workflow按预设规则执行,Agent自主思考规划。二者互补共生,结合使用是AI落地的最佳实践。文章还推荐了Dify、Coze等可视化工具及LangGraph等开发框架,助你快速掌握AI自动化核心技术。
语言模型
——语言模型
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net