
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
通过LLamaFactory+Qwen3-VL-8B微调多模态医疗大模型
针对医疗影像解读链路长、报告非结构化程度高的问题,基于Qwen3-VL-8B开发垂直领域多模态大模型。实现涵盖影像简述、结构化诊断记录及病灶区域定位等多任务辅助诊疗系统。
基于人类偏好的大语言模型评价与奖励模型构建
随着大语言模型的迅速发展,模型不仅需要具备强大的功能,更需要使其回复能符合人类的偏好。本项目通过分析真实对话数据,开发能够模拟人类真实偏好的偏好预测模型。这是基于人类反馈的强化学习(RLHF) 过程中的关键环节,旨在让 AI 通过学习人类的选择偏好来持续优化自身性能。数据项目使用数据集为。
到底了







