logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型效果优化方案(经验分享)

本文以2025国际大数据竞赛为例,探讨了拍照识题与解题的技术方案。比赛要求通过手机拍摄的数学题目照片进行自动解题,涉及小学至大学不同难度的选择题、填空题等题型。文章重点分析了OCR+LLM和多模态大模型两种技术路线的优劣,并针对数据稀缺、题型多样、图文混排等挑战,提出了包括数据增强、多模态融合、模型优化等解决方案。特别推荐Qwen2.5-VL-3B-Instruct多模态模型,通过视觉-语言联合训

文章图片
#经验分享#python#人工智能 +1
Claude Code 命令行工具的安装、配置与使用指南

Claude是Anthropic推出的专注于安全性与工程可靠性的AI语言模型系列,包含Opus、Sonnet和Haiku三个层级模型,分别针对不同复杂度任务。其计费基于token,代码场景token消耗较大。 Claude Code是Claude的官方命令行工具,提供代码理解、Git变更分析、多轮交互等核心能力,支持CLI命令式和REPL交互式两种使用模式。安装需Node.js环境,在VSCode

文章图片
#windows
Claude Code 命令行工具的安装、配置与使用指南

Claude是Anthropic推出的专注于安全性与工程可靠性的AI语言模型系列,包含Opus、Sonnet和Haiku三个层级模型,分别针对不同复杂度任务。其计费基于token,代码场景token消耗较大。 Claude Code是Claude的官方命令行工具,提供代码理解、Git变更分析、多轮交互等核心能力,支持CLI命令式和REPL交互式两种使用模式。安装需Node.js环境,在VSCode

文章图片
#windows
Hugging Face使用指南

本文介绍了大模型训练的完整流程,包括预训练、微调和后训练三个阶段。预训练阶段利用大规模无标注数据建立基础语言理解能力,微调阶段使用标注数据适配具体任务,后训练阶段通过SFT、RLHF等方法提升模型对齐能力和实用性。文章还详细介绍了Hugging Face生态系统及其核心组件,特别是accelerate框架如何简化分布式训练。最后提供了模型加载的API总览,涵盖从基本加载到高级配置的多种方法。整个训

文章图片
#python#azure#云平台 +2
静态库和动态库的区别以及在C/C++中的调用方法

静态库(.lib)和动态链接库(.dll)是在Visual Studio(VS)中开发和构建应用程序时使用的两种不同类型的库文件,它们在应用程序开发中有不同的用途和特性。

文章图片
#windows#经验分享#qt +1
到底了