logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型初学者必看大模型微调指南:Unsloth官方微调技巧大公开!

AI大模型微调指南:从入门到实践 本文介绍了大模型微调的基本流程和关键步骤,帮助初学者快速上手专业领域AI应用。主要内容包括: 微调概念:在预训练模型基础上,使用特定数据调整参数,实现知识更新、行为定制和任务优化。 微调步骤: 选择合适模型(先小后大)和微调方法(Lora/QLora) 设置关键参数:max_seq_length、dtype、load_in_4bit 准备数据集:CPT格式、Alp

文章图片
#人工智能
大模型初学者必看大模型微调指南:Unsloth官方微调技巧大公开!

AI大模型微调指南:从入门到实践 本文介绍了大模型微调的基本流程和关键步骤,帮助初学者快速上手专业领域AI应用。主要内容包括: 微调概念:在预训练模型基础上,使用特定数据调整参数,实现知识更新、行为定制和任务优化。 微调步骤: 选择合适模型(先小后大)和微调方法(Lora/QLora) 设置关键参数:max_seq_length、dtype、load_in_4bit 准备数据集:CPT格式、Alp

文章图片
#人工智能
狠狠码住❗️程序员想提升技术栈,看这篇就够

####🧑‍💻程序员必看!掌握AI大模型=职场加速器,未来三年想转型、跳槽涨薪的码住了!###🔥为什么说2025年是程序员学AI的黄金年?◾️GitHub报告:使用AI工具的开发者代码效率提升57%◾️薪资💰翻倍:AI岗位薪资比普通开发岗高82%◾️字节\腾讯等大厂组建“AI原生部门”,掌握AI大模型你也可以冲🎯有想提升技术栈能力、或有想法转型AI大模型应用开发领域的程序员们,有规划很关

文章图片
#人工智能#语言模型
狠狠码住❗️程序员想提升技术栈,看这篇就够

####🧑‍💻程序员必看!掌握AI大模型=职场加速器,未来三年想转型、跳槽涨薪的码住了!###🔥为什么说2025年是程序员学AI的黄金年?◾️GitHub报告:使用AI工具的开发者代码效率提升57%◾️薪资💰翻倍:AI岗位薪资比普通开发岗高82%◾️字节\腾讯等大厂组建“AI原生部门”,掌握AI大模型你也可以冲🎯有想提升技术栈能力、或有想法转型AI大模型应用开发领域的程序员们,有规划很关

文章图片
#人工智能#语言模型
2025最新秋招大模型面试八股文大全:高频考点一网打尽,背完这篇稳进大厂!

摘要: 本文汇总了大模型算法岗常见面试题及答案,分为基础篇和进阶篇。基础篇涵盖主流开源模型体系(如Transformer、Hugging Face)、模型架构(如GPT、BERT)、Tokenizer实现原理等;进阶篇探讨LLM输入长度限制、复读机问题及解决方案,并对比不同模型(如BERT、LLaMA、ChatGLM)的适用场景。随着大模型技术及岗位竞争加剧,掌握这些核心知识对求职者至关重要。

文章图片
#面试#职场和发展#自然语言处理 +1
2025最新秋招大模型面试八股文大全:高频考点一网打尽,背完这篇稳进大厂!

摘要: 本文汇总了大模型算法岗常见面试题及答案,分为基础篇和进阶篇。基础篇涵盖主流开源模型体系(如Transformer、Hugging Face)、模型架构(如GPT、BERT)、Tokenizer实现原理等;进阶篇探讨LLM输入长度限制、复读机问题及解决方案,并对比不同模型(如BERT、LLaMA、ChatGLM)的适用场景。随着大模型技术及岗位竞争加剧,掌握这些核心知识对求职者至关重要。

文章图片
#面试#职场和发展#自然语言处理 +1
AI大模型实操演示:如何在LangChain+Ollama中使用 Tool (Function Call)_ollama 使用tools

本教程介绍了如何使用LangChain框架中的Tool功能创建自定义工具,包括获取天气和时间信息。首先需要安装LangChain环境,然后通过定义工具函数、创建工具列表、设计提示模板和输出解析器四个步骤实现功能。其中特别强调工具描述字段会影响大语言模型的选择准确率,并详细解析了中间步骤记录的处理逻辑和输出解析流程。教程提供了完整的代码实现,帮助开发者理解如何构建基于语言模型的应用程序。

文章图片
#人工智能#语言模型
AI大模型实操演示:如何在LangChain+Ollama中使用 Tool (Function Call)_ollama 使用tools

本教程介绍了如何使用LangChain框架中的Tool功能创建自定义工具,包括获取天气和时间信息。首先需要安装LangChain环境,然后通过定义工具函数、创建工具列表、设计提示模板和输出解析器四个步骤实现功能。其中特别强调工具描述字段会影响大语言模型的选择准确率,并详细解析了中间步骤记录的处理逻辑和输出解析流程。教程提供了完整的代码实现,帮助开发者理解如何构建基于语言模型的应用程序。

文章图片
#人工智能#语言模型
一文彻底搞懂检索增强生成(RAG) 优化策略_rag优化

检索增强生成(RAG)通过结合检索模块与生成模型提升大模型输出质量。文章系统介绍了RAG工作流程的四大核心模块:文档块切分(多粒度切分、语义切分等)、文本嵌入模型(微调、动态表征)、提示工程(模板优化、改写)以及大模型迭代(微调、量化训练)。同时提出架构优化策略,如元数据过滤、重排序减少冗余文档块。文末还提供了包含640份行业报告、学习视频等资料的LLM大模型资源包,助力开发者系统掌握RAG技术。

文章图片
#人工智能#AI#RAG
一文彻底搞懂检索增强生成(RAG) 优化策略_rag优化

检索增强生成(RAG)通过结合检索模块与生成模型提升大模型输出质量。文章系统介绍了RAG工作流程的四大核心模块:文档块切分(多粒度切分、语义切分等)、文本嵌入模型(微调、动态表征)、提示工程(模板优化、改写)以及大模型迭代(微调、量化训练)。同时提出架构优化策略,如元数据过滤、重排序减少冗余文档块。文末还提供了包含640份行业报告、学习视频等资料的LLM大模型资源包,助力开发者系统掌握RAG技术。

文章图片
#人工智能#AI#RAG
    共 372 条
  • 1
  • 2
  • 3
  • 38
  • 请选择