登录社区云,与社区用户共同成长
邀请您加入社区
26年1月来自普林斯顿和Temple U的论文“Video Generation Models in Robotics: Applications, Research Challenges, Future Directions”。视频生成模型已成为物理世界的高保真模型,能够合成高质量视频,捕捉智体与其环境之间基于多模态用户输入的精细交互。它们强大的功能解决许多基于物理模拟器长期面临的挑战,推动其在
本文介绍基于 RAG 的 PDF 问答 Demo,支持用户上传 PDF 后检索相关段落并结合大模型生成答案,核心技术栈含 Chroma 向量库、ChatZhipuAI 大模型、FastEmbedEmbeddings 文本嵌入。核心类 ChatPDF 封装文档入库、检索、问答全流程,通过 ingest () 建索引、ask () 实现问答,RAG 流程保障回答源自指定文档。使用前需配置并通过环境变量
GTU(Tanh-Sigmoid门控)是深度学习中的一种门控机制,通过tanh生成信息内容(-1到1),sigmoid生成门控信号(0到1),两者相乘输出。其核心思想是分离"内容"与"开关",类似水坝控制水流。相比主流GLU,GTU存在双重梯度消失问题,导致训练困难。但在特定场景仍有价值:输出需严格限制在[-1,1]的任务(如图像生成)、与LSTM混合架构的兼容性、浅层网络的强非线性需求以及数值稳
【摘要】宏智树AI科研工具针对大学生课程论文写作痛点,提供全流程解决方案。通过课程精准适配功能,自动匹配知识点与评分重点;真实文献引用对接权威数据库;支持个性化补充避免模板化;一键排版与查重功能节省80%机械时间。相比其他AI工具,宏智树AI在课程贴合度、学术规范性和效率提升方面表现突出,实测1小时即可完成高质量课程论文,帮助学生在不熬夜的情况下获得高分。该工具强调辅助写作而非代写,符合高校学术规
本文记录了安装OpenAI Gym环境的踩坑过程,重点解决Python 3.5.2版本兼容、Gym 0.20.0依赖冲突等问题。针对conda环境配置、mujoco_py编译失败等常见错误,提供了添加conda-forge通道、安装GCC开发库等解决方案。同时分享了FetchPush-v1等环境的训练和演示命令,帮助开发者快速搭建强化学习实验环境。适用于Ubuntu/Windows系统,包含从基础
TTT-Discover 证明了 AI 的潜力不应仅仅局限于“预训练知识的提取”,更在于其作为“研究助手”进行自我演化的能力。通过在测试阶段针对特定问题进行强化学习,AI 已经展现出在数学、编程优化和科学计算等领域超越人类顶级水平的潜力。正如论文引言所说,人类解决难题需要“试错、学习、再尝试”,TTT-Discover 正是赋予了 AI 这种从失败中内化新思路的能力。
文章详解大模型训练三阶段:预训练阶段让模型"博览群书"学习语言知识;指令微调阶段教会模型理解人类意图并按特定格式回复;对齐阶段通过反馈机制使模型回答符合人类价值观(有用、诚实、无害)。这三个阶段分别对应从基座模型到聊天机器人再到最终对齐模型的转变过程。
本文系统梳理了AI大模型的14个核心概念,从基础架构(Transformer)、数据处理(Token与Embedding)到训练优化(预训练、微调、对齐),再到前沿应用(RAG、Agent、MCP等)。文章深入浅出地解释了大模型如何实现"智能涌现",并探讨了幻觉问题、提示工程等关键技术挑战。这些相互关联的概念共同构成了现代大模型技术全景图,是理解AI发展路径的重要基石,适合小白和程序员系统学习大模
RAG技术并未消亡,而是被重新品牌为"上下文工程",成为AI开发新趋势。MCP与上下文工程正取代传统提示工程,Contextual AI等公司推出智能体编排器工具,帮助开发者管理上下文状态、构建企业级智能体应用。上下文工程涉及系统指令、工具、MCP、外部数据等全方位管理,是智能体时代的核心技术,为企业提供安全可靠的AI解决方案。
RAG(检索增强生成)技术通过结合信息检索与文本生成,解决大模型知识更新滞后、幻觉、数据安全等问题。核心流程包括检索(向量检索+文本分块)、融合(拼接或注意力机制)和生成。相比传统大模型,RAG具有实时知识更新、减少幻觉、保障数据安全和低成本高效的优势。已在智能客服、专业领域辅助和个人知识库等场景广泛应用,未来将向多智能体协作、跨模态检索等方向发展。
文章介绍了RAG系统的6类幻觉问题及4个缓解策略,包括过度自信、过时性等类型,以及预检索查询优化、后检索参考识别等阶段;同时探讨了科研文生图方案,对比了直接画像素与先写代码再生成图两种方法,介绍了"科学画图考试题库"(SciGenBench)。研究显示,代码生成的图像精准度更高,直接画像素的视觉效果更优,使用高质量图像训练大模型可显著提升其解题能力。
本文详细记录了作者花一周时间为传统研发平台接入Agent开发能力的完整实践。采用宿主页面Iframe嵌入方式,结合集团Faas基建、Next.js+React和LangGraph框架构建了BFF Agent。重点介绍了系统提示词优化、知识库建设、工具接入及上下文管理等关键技术,特别是通过XML格式提示词、RAG知识库和上下文压缩等技术解决了大模型在特定领域(TQL)的应用难题,实现了AI辅助编程的
Ralph Loop是一种解决AI编程助手过早退出问题的方法,通过Stop Hook拦截机制让AI持续迭代直至任务真正完成。其核心是循环使用同一提示,结合文件系统和Git历史形成自我参照反馈。该方法不依赖AI主观判断,而是通过外部验证确保任务完成。文章详细介绍了实现机制、适用场景、最佳实践及框架支持,帮助开发者构建高效AI编程工作流。
SWIRL是开源企业级AI搜索和RAG平台,无需迁移数据或搭建向量数据库,Docker一行命令即可部署。支持连接100+企业应用(SharePoint、Confluence等),保留原有权限控制,提供知识库搜索、客服助手、开发助手等功能。后端采用Python+Django,支持联邦搜索和智能排序,帮助团队平均每周节省7.5小时,适合数据分散在多个系统的企业使用。
UltraRAG 3.0是由清华大学等机构联合开发的基于MCP的轻量级RAG框架,获GitHub 4600+ Star。其三大核心优势:YAML配置自动生成Web界面,Show Thinking面板实现全链路白盒化,内置智能开发助手简化配置过程。该项目解决了传统RAG开发中UI编写、流程监控和配置学习的痛点,特别适合知识库问答、深度研究等场景,让AI开发更直观高效。
文章详细介绍了RAG(检索增强生成)技术的实战应用,包括LLM需要RAG的原因(幻觉、时效性、数据安全)、RAG架构与模块(版面分析、知识库构建、大模型微调、知识问答)、RAG相较于LLM的优势(可扩展性、准确性等)、RAG与SFT的区别,以及各模块的具体实现方法和优化策略。同时推荐了多个RAG开源项目,帮助开发者从零构建企业级RAG应用,解决大模型幻觉问题,提升回答的准确性和可靠性。
本文详细介绍了AI Agent记忆系统的概念、分类及实现架构,包括短期记忆的上下文工程策略(压缩、卸载、摘要)和长期记忆的技术架构(记录与检索流程)。文章对比了Google ADK、LangChain和AgentScope等主流框架的记忆系统实现,分析了行业发展趋势,并提供了Mem0等长期记忆组件的集成方案,为构建高效、个性化的AI Agent提供了技术指导。
文章介绍了一个基于上下文工程的Agent后端架构设计,围绕四大核心模块:工具模块和管理、上下文管理、LLM模块和Agent执行器。该架构将上下文管理作为核心,统一管理各类上下文,通过LLM模块处理用户请求,并结合工具模块扩展能力。作者提供了CLI脚手架工具,帮助开发者快速实践这一架构,使开发重心集中在上下文获取与整理上,同时保持LLM作为核心,便于后续升级。
本文总结了Nature期刊风格科研绘图的核心准则与AI生成提示词,适用于框架图、流程图等学术配图。重点包括:1)视觉上采用矢量图、高分辨率、浅色背景;2)配色以黑白灰为主,单色点缀;3)线条粗细分层,布局对称紧凑。提供了中英文通用提示词及框架图、流程图专属提示词,涵盖AI模型、实验流程、数据处理等类型。同时给出Midjourney、国内AI工具及矢量绘图软件的微调技巧,便于研究者快速生成符合期刊要
(epoch, epochs, time.time()-start_time, plt_train_loss[-1], plt_val_loss[-1]))#打印当前轮次、耗时、训练损失和验证损失。val_x, val_y = val_x.to(device), val_y.to(device)#将验证数据转移到设备上。return self.X[item].float(), self.Y[ite
在ChatGPT等生成式AI席卷全球的今天,留学生群体中一个热议且充满争议的话题便是:用AI写的Essay,是否可以直接提交给学校?这看似是一个关于效率的捷径,实则隐藏着关乎学术诚信、毕业风险乃至未来职业发展的深层挑战。本文将深入剖析现状,并为你指明一条安全、高效的辅助写作路径。
本文介绍了模型微调技术在预训练模型中的应用。微调通过在预训练模型基础上使用特定任务数据进行额外训练,实现知识迁移和任务适配。文章详细阐述了微调流程,包括模型选择、数据准备、架构适配、训练策略和评估优化等步骤,并以BERT情感分析为例展示了实践案例。同时分析了常见问题及解决方案,探讨了参数高效微调等进阶技术。微调作为连接通用模型与具体任务的关键技术,能充分利用预训练模型能力,快速构建高性能AI应用系
在之前的文章【机械臂】【Agent】一、Agent与其它模块的通信设计-CSDN博客中,我实现了llm、agent、vision、controller模块之间的通信,简单来讲,llm与agent之间由我自己定义的msg进行话题通信,agent与vision之间由我自己定义的msg进行话题通信,agent与controller之间由我自己定义的srv进行服务通信。在这一节中,我将对代码以及通信架构进
在学术写作、留学申请及内容创作领域,AI辅助工具已极大地提升了效率。然而,随之而来的挑战是如何确保生成的英文文本能够通过如Turnitin、GPTZero等日益精密的AI检测系统。对于追求效率与诚信并重的作者而言,科学地降低AI率已成为一项关键技能。本文将深入解析AI检测逻辑,并提供一套可操作的、包含具体英文例句的优化策略。
Spring AI 进阶:RAG 技术原理拆解与本地知识库检索落地
文章详解了大模型内部工作原理,区分了训练(学习知识)、推理(应用知识)和微调(塑造专长)三大阶段。深入剖析了Transformer架构,包括文本分词、嵌入层处理、编码器-解码器协同工作机制。解释了主流模型采用约96层而非更多层的原因:边际效应递减、梯度消失、算力延迟和过拟合风险。强调了大模型扩展定律:模型层数必须与数据量匹配,才能实现最佳性能。
摘要:课程论文是大学生常见的学业负担,常面临选题困难、格式繁琐、查重焦虑等问题。虎贲等考AI推出智能课程论文功能,提供选题推荐、文献匹配、格式自动排版和查重优化等一站式服务。该工具能3分钟生成选题框架,10分钟配齐文献素材,自动适配各高校格式要求,并实现轻量化降重。实测显示使用该工具可大幅提升效率,帮助学生用2-3小时完成高质量论文,避免熬夜凑字数的困扰,实现高效学习与轻松拿分的平衡。
摘要:虎贲等考AI智能写作平台通过AI赋能重构数据分析流程,帮助科研人员高效完成符合学术规范的数据分析。平台提供12大学科专属分析方案,支持零代码操作,3步即可生成完整分析报告,自动校验模型适用性并标注结果细节。其特色在于实现"数据分析-论文写作"无缝衔接,可自动生成学术化结论和建议,支持图表一键插入论文。实测案例显示,该平台能显著提升研究效率,让用户聚焦研究核心而非软件操作,
【论文投稿神器推荐】实测5款AI工具后发现,宏智树AI能一站式解决期刊论文写作痛点:1)精准匹配期刊选题偏好;2)对接权威数据库确保文献真实可查;3)自动生成符合规范的实证图表;4)内置上千种期刊排版模板;5)智能降重同时消除AI痕迹。相比其他仅解决单一环节的工具,宏智树AI覆盖从选题到投稿全流程,特别适合被格式、文献、刊性适配等问题困扰的研究者。官网www.hzsxueshu.com可免费体验,
宏智树AI是一款专为学术论文优化的智能工具,能同时解决查重率高和AI生成痕迹明显两大难题。不同于普通工具的简单换词或删改,它采用AI5.0技术进行深度语义重构,在保留核心观点和学术术语的基础上,补充论据、完善逻辑链条,使论文更严谨专业。其降AIGC功能通过注入个性化案例、优化学术话术,有效消除机械感。支持网页和公众号使用,提供个性化修改强度选择,适合本科到期刊论文的不同需求,既能快速通过审核,又能
《宏智树AI:学术写作全流程智能解决方案》摘要:宏智树AI基于ChatGPT学术版与AI5.0技术,提供覆盖论文全生命周期的智能服务。平台具备大纲生成、文献综述、数据可视化等核心功能,支持12大学科专业适配,实现从开题到答辩的一站式辅助。其特色包括:30秒快速响应、学术规范校验、查重降重一体化及数据智能分析,在保证学术合规性的同时提升写作效率3-5倍。采用军事级数据加密技术,确保用户学术成果安全,
作为深耕论文写作科普的教育博主,后台被问得最多的灵魂拷问,除了选题,就是文献综述:“下载了 50 篇文献,堆在桌面无从下手”“写出来的综述像流水账,只有‘谁研究了什么’,没有逻辑和深度”“引用文献要么虚假溯源,要么格式混乱,被导师打回重写”……其实很多人都陷入了一个误区:文献综述不是 “文献堆砌”,而是 “学术脉络梳理 + 批判性分析”,但传统写作模式下,筛选文献、梳理逻辑、规范引用这三件事,就能
宏智树AI是一款专为毕业论文写作设计的智能工具,通过"选题-框架-内容-格式-答辩"全流程引导,帮助新手高效完成符合学术规范的论文。其核心优势包括:1)选题引导功能,结合学术热点推荐创新性选题;2)自动生成符合学科特点的论文框架;3)引用真实文献数据,确保内容可靠性;4)一键适配学校格式要求。相比其他写作软件,宏智树AI不仅提供写作辅助,更融入论文写作科普,帮助用户掌握学术写作
【论文AI工具测评:宏智树AI成毕业季最优解】经多款主流AI写作软件实测对比,宏智树AI凭借全流程合规设计脱颖而出,完美契合毕业论文严苛要求。其核心优势在于:1)选题阶段提供热点分析与可行性评估;2)写作环节确保文献真实可查、数据权威可溯;3)后期优化实现智能查重与自动排版。相比同类工具存在的文献造假、格式混乱等问题,宏智树AI真正实现从选题到答辩的一站式合规辅助,帮助用户20天内完成查重率12%
本文介绍了智能体(Agent)系统中大模型落地的关键技术——有监督微调(SFT)和LoRA方法。通过对比基模+Prompt、基模+Prompt+RAG和SFT三种方案,分析了各自适用场景及优劣势。详细阐述了SFT微调流程,包括语料设计、样本生成、参数设置等关键步骤,并解释了LoRA低秩适应的高效原理。文章还提供了训练参数组合建议,指出工程实践中准确率维护、细粒度评估等挑战。最后强调合理运用这些技术
与LeNet有相同之处,也有很多区别;比如适用大尺寸的图像所以使用11X11这种大尺寸的卷积核使用Relu激活函数,对比tanh/sigmoid激活函数,训练更快且避免梯度消失dropout随机使得一些神经元失活防止过拟合(用在全连接层)LRN局部归一化:正则项,防止过拟合# input_size还必须是元组,使用列表就会报错,,,,AlexNet中使用了dropout,resnet丢弃dropo
算法备案难度极高,需要十分熟悉流程、材料的人员完成。今天我们不聊是否需要请代办机构这个话题,直接说说产品急于上线,已经准备请代办协助的企业要如何选择靠谱代办。下面是我罗列的一些评判维度,如果还有疑问,可以直接和我沟通。
结合多种分块方法的优点,如先按段落分块,再根据块大小调整,做到既保持语义完整性,又能控制块大小均匀。
根据《互联网信息服务算法推荐管理规定》政策,算法备案已经成为了强制性备案。但对于企业而言,如何准确判断自身算法所属的备案类型往往存在困惑,今天我们就来详细盘一盘算法备案的类型,教你如何判断自己的算法属于哪一类。
算法备案全称为互联网信息服务算法备案,是依据《互联网信息服务算法推荐管理规定》,由网信办主导,与公安部、工信部、市监总局等联合推行的强制性备案制度,旨在规范互联网信息服务算法推荐活动,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益,促进互联网信息服务健康有序发展。根据规定,生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等具有舆论属性或者社会动员能力、涉及用户数据收集和
《排序精选类算法备案操作指南》摘要 随着《互联网信息服务算法推荐管理规定》实施,排序精选类算法备案成为企业合规运营的必要环节。本文提供详细备案指南:首先明确排序精选类算法指对网络信息内容进行排列、筛选的算法,广泛应用于搜索引擎、社交媒体等场景。备案流程分为主体备案、算法备案和产品备案三阶段,需填写算法基础属性、详细属性、模型参数等内容,重点说明数据来源、排序依据和风险防范机制。备案材料需包含安全自
结合此前算法备案制度的演进历程来看,自 2022 年 3 月 “互联网信息服务算法备案系统” 正式上线以来,我国已逐步建立起 “实质备案 + 材料审查” 的严格标准,要求备案主体提交算法原理、训练数据来源、风险防范机制等核心材料,尤其是生成式 AI 类算法需标注 “已备案” 水印,算法可解释性与用户权益保护成为备案审核的核心要点。另一方面,需持续落实算法安全主体责任,定期开展算法自评估,防范数据泄
文章围绕深度合成算法备案展开。先强调其重要意义,接着明确备案主体与范围,包括主体区分和范围确定步骤。详细阐述备案材料准备内容,如安全责任、自评估报告、公示内容。还介绍备案流程各环节和注意事项及备案期限。
一分钟高质量回答模板:“从零训练一个大模型,可以分为三步:第一阶段是数据准备,包含数据收集、清洗、分词和配比,是模型能力的上限;第二阶段是预训练,目标是学习语言与世界知识,关键在任务设计与分布式训练;第三阶段是后训练,也就是对齐,包括SFT和RLHF,让模型从‘会说话’到‘懂人话’;过程中还要考虑缩放定律、过拟合与梯度稳定性问题,这些都会影响模型最终性能。这样的回答,既系统又有实操味,面试官听完基
未全面介绍算法的主要功能,如只提及了部分核心功能,遗漏了一些辅助功能或特殊功能,影响对算法整体功能的评估。
根据《互联网信息服务算法推荐管理规定》及实施细则,算法或产品功能更新后是否需要重新备案,主要取决于变更是否构成“
继上次大模型备案问答第二期更新后,大家催更已久的算法备案第二期来啦!我尽量选择大家都比较关心的问题做批量回答系列,如果平时的文章没有贴切解决大家的问题,以后这个回答系列还会继续更新,大家可以把咨询的问题在评论区或后台告诉我。
深度学习
——深度学习
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net