logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen2大模型微调入门实战(完整代码)

微调是通过在(指令,输出)数据集上训练来改善LLMs理解人类指令的能力。教程中,使用Qwen2-1.5B-Instruct模型在zh_cls_fudan_news数据集上进行微调,并借助SwanLab进行监控和可视化

文章图片
#人工智能
你的供应链还在“裸奔”吗?这份AI转型蓝图,AI产品经理看完都收藏!

我们将从“为什么要做”的战略必要性,到“做什么”的核心AI模块,再到“怎么做”的技术架构和落地路线图,为你提供一套完整的解决方案。

文章图片
#人工智能#产品经理
利用腾讯混元大模型搭建Cherry Studio自有知识库,打造“智能第二大脑”

Cherry Studio 的定位:作为一个轻量化的知识管理与 AI 助手平台,Cherry Studio 需要一个高效、可扩展的知识库来支撑日常问答、文档检索和自动化工作流。

文章图片
#github#python#人工智能 +2
AGI 远不止 ChatGPT!一文入门 AGI 通识及应用开发

近半年来,整个行业都在致力于研发和应用大型模型。这涉及到算力的提升、大型模型算法的优化以及相关语料和数据的准备。行业对此非常关注,各个参与者都铆足干劲,特别是一些大型企业纷纷下水,担心被 AI 浪潮拍在沙滩上。

文章图片
#人工智能
告别天价算力!2025性价比最高的LLM私有化训练路径,大模型入门到精通,收藏这篇就足够了!

今天我们分享一下最值得关注的 4 款工具 —— 从单卡 到支持万亿参数的分布式集群,它们几乎覆盖了所有 LLM 微调场景,让我们看看该在什么时候用哪一个。让你一文掌握主流框架特性、性能对比与实战选型策略。

文章图片
#机器学习#人工智能#RAG
轻松搞定百个大模型微调!LLaMA-Factory:你的AI模型量产神器

LLaMA-Factory是一个强大且易用的工具,极大地降低了大模型微调的门槛。无论你是想要进行学术研究,还是为企业构建定制化AI解决方案,它都能为你提供强有力的支持。

文章图片
#人工智能
零基础玩转LLaMA-Factory!轻松微调专属大模型,保姆级教程来袭

LLaMA-Factory的出现,彻底降低了大模型定制化的门槛。现在,即使是个体开发者或小团队,也能在有限资源下打造专属的智能助手!

文章图片
#人工智能
《大模型应用系列|用LLama Factor微调Qwen、Deepseek等大语言模型,定制化你的专属大模型》

如果你希望打造一个「懂你、听你、按你要求说话」的专属大模型,那么你一定要了解今天的主角:LLama Factory:一站式大模型微调平台

文章图片
#人工智能
Github-LangChain:构建可靠AI代理的终极框架

LangChain不仅是连接LLM组件的框架,更是一个完整的AI应用开发生态系统。它通过标准化接口、丰富的集成和灵活的架构,显著降低了构建复杂AI应用的难度,同时确保了应用的可维护性和未来兼容性。

文章图片
#github#人工智能#自然语言处理 +2
产品经理必须懂得AI:ChatGPT-人工智能对话的新篇章

ChatGPT是2023年最火的AI应用了。这篇文章,作者梳理了ChatGPT的工作原理,以及LLM模型的训练、优化和应用、影响和未来,对于现在AI能帮助大家工作的同时,给大家带来不一样的思考。

文章图片
#人工智能#产品经理#自然语言处理
    共 1426 条
  • 1
  • 2
  • 3
  • 143
  • 请选择