
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本篇总结了显卡利用率评估方法及显卡运用优化方法。本篇来总结一些显卡优化的经验,还是按照面经的形式给出,希望能给到大家一些实际训练效率优化的帮助~下面是一个快捷目录。一、如何评估显卡利用率?二、如何优化显存利用率?使用deepseed时,zero3如果没有 nvlink,多卡训练下会变慢很多,下面有三种方法来评估训练时发挥了多少GPU性能。采用Nvidia可参考的显卡峰值计算速度进行计算实测的flo

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

文章系统分析了2025年AI行业的五大发展方向:技术研发层(大模型训练、AI芯片设计等)、应用落地层(AI产品经理、解决方案架构师等)、跨学科融合层(AI+生物/碳中和/创意)、伦理治理层(数据隐私、算法审计)和教育传播层(培训师、内容创作者),详细列出各方向职位、薪资、核心职责和必备技能,为不同背景人才提供精准职业定位和技能培养建议,帮助把握AI大模型时代发展机遇。
文章系统分析了2025年AI行业的五大发展方向:技术研发层(大模型训练、AI芯片设计等)、应用落地层(AI产品经理、解决方案架构师等)、跨学科融合层(AI+生物/碳中和/创意)、伦理治理层(数据隐私、算法审计)和教育传播层(培训师、内容创作者),详细列出各方向职位、薪资、核心职责和必备技能,为不同背景人才提供精准职业定位和技能培养建议,帮助把握AI大模型时代发展机遇。
多模态大模型突破单一模态限制,可同时处理文本、图像、音频等多种信息。文章详解其概念、关键技术(模态表示学习、对齐与融合)、应用场景(智能驾驶、医疗诊断等)、评估指标及主流开源模型(GPT-4V、Gemini等)。通过融合多源数据,提供更全面的AI解决方案,正推动各行业智能化变革,是程序员和AI从业者必学技术。
多模态大模型突破单一模态限制,可同时处理文本、图像、音频等多种信息。文章详解其概念、关键技术(模态表示学习、对齐与融合)、应用场景(智能驾驶、医疗诊断等)、评估指标及主流开源模型(GPT-4V、Gemini等)。通过融合多源数据,提供更全面的AI解决方案,正推动各行业智能化变革,是程序员和AI从业者必学技术。
本文详细介绍了15种提升RAG系统效果的数据分块策略,包括逐行分块、滑动窗口、语义分块等方法。每种策略都有适用场景和注意事项,如表格分块适合结构化数据,语义分块能减少检索时的上下文缺失。文章强调不存在"万能分块策略",需根据文档格式和使用场景灵活选择,并通过真实数据测试验证效果,避免大模型产生幻觉。掌握这些策略可显著提升RAG系统的检索准确性和生成质量。

本文详细介绍了15种提升RAG系统效果的数据分块策略,包括逐行分块、滑动窗口、语义分块等方法。每种策略都有适用场景和注意事项,如表格分块适合结构化数据,语义分块能减少检索时的上下文缺失。文章强调不存在"万能分块策略",需根据文档格式和使用场景灵活选择,并通过真实数据测试验证效果,避免大模型产生幻觉。掌握这些策略可显著提升RAG系统的检索准确性和生成质量。

本文详细介绍了15种提升RAG系统效果的数据分块策略,包括逐行分块、滑动窗口、语义分块等方法。每种策略都有适用场景和注意事项,如表格分块适合结构化数据,语义分块能减少检索时的上下文缺失。文章强调不存在"万能分块策略",需根据文档格式和使用场景灵活选择,并通过真实数据测试验证效果,避免大模型产生幻觉。掌握这些策略可显著提升RAG系统的检索准确性和生成质量。

本文解析了LLM、RAG与AI代理三大AI智能构建体的区别与协同。LLM作为推理引擎提供基础智能,RAG通过检索外部知识增强准确性与时效性,AI代理则赋予系统行动能力,实现从思考到行动的闭环。三者协同工作,构成完整智能系统:LLM负责思考,RAG负责知晓,代理负责行动,共同推动AI从文本生成器向智能助手演进。---








