logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

峰哥爆肝整理:大模型微调进阶32问

本文分享了关于大模型微调的25个关键问题及解决方案,涵盖全量微调显存需求、SFT数据构建、领域模型训练、多轮对话微调等核心内容。作者指出,微调应注重数据质量而非数量,推荐使用LoRA等高效方法,并强调混合通用数据以防止灾难性遗忘。文章还探讨了预训练与微调的区别、优化器选择、batch size设置等技术细节,并提供了处理loss突刺等问题的实用技巧。最后总结了微调大模型的"终极心法&qu

文章图片
#人工智能
峰哥爆肝整理:大模型微调进阶32问

本文分享了关于大模型微调的25个关键问题及解决方案,涵盖全量微调显存需求、SFT数据构建、领域模型训练、多轮对话微调等核心内容。作者指出,微调应注重数据质量而非数量,推荐使用LoRA等高效方法,并强调混合通用数据以防止灾难性遗忘。文章还探讨了预训练与微调的区别、优化器选择、batch size设置等技术细节,并提供了处理loss突刺等问题的实用技巧。最后总结了微调大模型的"终极心法&qu

文章图片
#人工智能
通用专业级大模型部署Docker基础环境的DockerFile构建(九章云极提供)

我们平时训练微调大模型或部署大模型应用时,会通常用到镜像文件,本文提供通用且专业镜像文件,如有其它组件需安装,则可在Dockerfile文末追加。

#docker#容器#运维
豆包、midjourney、stable diffusion生图提示词大全

豆包、midjourney、stable diffusion生图提示词大全

#人工智能
谷歌AI Agent白皮书:2025年AI智能体时代来临

本文探讨了生成式AI Agent的核心架构与工作原理。Agent通过整合语言模型、工具和编排层,实现了超越基础模型的能力:1)利用工具扩展功能,访问实时数据并执行现实操作;2)采用ReAct、思维链等推理框架进行决策规划;3)通过扩展程序、函数调用和数据存储三种工具类型实现外部系统交互。文章详细解析了Agent的认知架构组成,对比了不同工具的应用场景,并指出目标学习(上下文学习、检索增强、微调)对

文章图片
#人工智能
谷歌AI Agent白皮书:2025年AI智能体时代来临

本文探讨了生成式AI Agent的核心架构与工作原理。Agent通过整合语言模型、工具和编排层,实现了超越基础模型的能力:1)利用工具扩展功能,访问实时数据并执行现实操作;2)采用ReAct、思维链等推理框架进行决策规划;3)通过扩展程序、函数调用和数据存储三种工具类型实现外部系统交互。文章详细解析了Agent的认知架构组成,对比了不同工具的应用场景,并指出目标学习(上下文学习、检索增强、微调)对

文章图片
#人工智能
开源语音TTS与ASR大模型选型指南(2025最新版)(疯聊AI提供)

开源语音大模型正重塑智能语音市场格局,TTS(文本转语音)和ASR(语音识别)技术取得显著突破。国产模型Speech-02-HD在TTS领域表现突出,支持32种语言和情感控制,在自然度和音色克隆方面领先。ASR领域,FireRedASR中文识别效果优异,Whisper多语言覆盖广。选型需考虑场景需求,如智能客服推荐Speech-02-HD+FireRedASR组合。未来趋势包括多模态融合、边缘计算

文章图片
#人工智能
2025.7.26字节掀桌子了,把coze开源了!!!

【摘要】字节跳动开源AI开发平台Coze,包含CozeStudio和CozeLoop两大核心组件。CozeStudio提供一站式AI智能体开发工具,支持零代码/低代码开发;CozeLoop专注于AI智能体全生命周期管理。两大项目均采用Apache2.0许可证,支持商业使用和私有化部署。此次开源将推动AI代理开发社区共建,降低开发者门槛。开源地址已公布,开发者可立即体验完整功能。

文章图片
#人工智能
实战:一文讲清ASR语音转文本大模型Faster-Whisper部署全过程

之前我们写了一篇《开源语音TTS与ASR大模型选型指南(2025最新版)》,里边埋了一个伏笔,就是我们的项目是用的哪个ASR大模型,本篇就给大家解密,并给大家分享详细的部署过程,相信大家在这过程中可以学到很多东西。

文章图片
#人工智能
一文读懂具身智能(基本概念、发展历程、政策推动、技术体系、产业现状、应用场景、市场现状、创业机会、就业机会、未来趋势)

一文了解具身智能的基本概念、发展历程、政策推动、技术体系、产业现状、应用场景、市场现状、创业机会、就业机会、未来趋势。

文章图片
#人工智能
    共 20 条
  • 1
  • 2
  • 请选择