logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

参数高效微调(PEFT)研究综述

近年来,随着深度学习模型规模的不断扩大,预训练大模型(Pre-trained Large Models)在自然语言处理(NLP)、计算机视觉(CV)等领域取得了显著的性能提升。参数高效微调(PEFT)作为一种高效的迁移学习方法,在降低计算资源消耗的同时,保证了模型的高性能表现。提示调优(Prompt Tuning)是近年来提出的一种微调方法,通过学习特定任务的输入提示(Prompt)向量,使预训练

文章图片
[特殊字符] 阿里开源 Qwen2.5-Omni [特殊字符] 全模态大模型详解

近年来,AI 大模型的飞速发展推动了多模态技术的革新!2025 年 3 月 27 日,阿里巴巴通义实验室正式发布,这是首个端到端全模态大模型🎉,支持文本📝、图像🖼️、音频🎵 和视频🎥 的处理,具备跨模态理解与生成能力。在OmniBench评测中,该模型甚至超越了 Google🏆!🧐 本文将从架构、技术创新、性能、应用场景、开源生态等方面,深入剖析 Qwen2.5-Omni!阿里以端到

文章图片
#人工智能
谷歌发布Agent2Agent:AI代理协作新范式,挑战MCP技术垄断格局

Agent2Agent的推出是谷歌在AI领域的一次重要布局,它以开放性和协作性为核心,挑战了MCP技术垄断的现状。尽管A2A尚处于早期阶段,其生态完善度和实际性能仍需验证,但其潜力不容忽视。未来,随着更多开发者加入,这一协议或将成为AI协作领域的行业标准。

文章图片
#人工智能
【MiniMind】从零开始训练大模型:开源LLM实践指南

🔗GitHub 地址MiniMind 项目提供了从数据处理到训练、微调的完整流程,核心亮点包括:✔轻量级模型:基础版本参数量仅 25.8M,适合个人开发者。✔全流程开源:包含数据预处理、预训练、监督微调(SFT)、LoRA 微调、DPO(直接偏好优化)等完整代码。✔原生 PyTorch 实现:方便二次开发,深入理解 LLM 训练原理。✔支持多模态扩展:官方还推出了视觉语言模型 MiniMind-

文章图片
#人工智能
Open WebUI 推出 mcpo:将 MCP Server 无缝转换为 OpenAPI 服务

在 AI 和大语言模型(LLM)的快速发展下,如何让不同协议的工具实现无缝集成成为开发者关注的重点。团队最新发布的(MCP-to-OpenAPI Proxy Server),可以将服务器的命令转换为标准的接口,使其更易于与 LLM 代理及其他应用程序兼容。本文将深入探讨的核心功能、使用场景及安装方法,帮助开发者更好地理解和应用这一新技术。是一个轻量级的,其主要作用是将的接口转换为,从而兼容 Ope

#人工智能
Open WebUI 推出 mcpo:将 MCP Server 无缝转换为 OpenAPI 服务

在 AI 和大语言模型(LLM)的快速发展下,如何让不同协议的工具实现无缝集成成为开发者关注的重点。团队最新发布的(MCP-to-OpenAPI Proxy Server),可以将服务器的命令转换为标准的接口,使其更易于与 LLM 代理及其他应用程序兼容。本文将深入探讨的核心功能、使用场景及安装方法,帮助开发者更好地理解和应用这一新技术。是一个轻量级的,其主要作用是将的接口转换为,从而兼容 Ope

#人工智能
LoRA微调详解:高效优化大模型的利器

LoRA 是一种高效的参数微调方法,通过引入低秩分解,显著降低了大型模型的训练成本,同时保持了预训练模型的性能。在实际应用中,LoRA 为研究人员和企业提供了一种轻量级的解决方案,使得微调大型模型变得更加可行。如果你正在从事大模型微调工作,不妨尝试使用 LoRA,相信它会让你的训练更加高效!📌 你觉得 LoRA 适合哪些场景?欢迎在评论区讨论!

文章图片
#人工智能
Google 开发者大会 2025 | AI 时代新突破,核心技术全解析

本次 Google 开发者大会全面展示了 AI 计算、生成式内容、代理系统、安全等领域的前沿进展,推动 AI 在实际应用中的落地。💡。

文章图片
#人工智能
前缀调整(Prefix-Tuning):一种优化生成任务的轻量级方法

前缀调整通过一个巧妙的设计,实现了高效性模块化和泛化能力的完美平衡。它不仅为 NLP 领域提供了一种新的任务适应方法,还为资源受限的场景(如移动设备)打开了大门。未来,可以探索将其应用于更大规模模型(如 GPT-3)或更多生成任务(如对话生成)。🚀一句话总结:前缀调整用 0.1% 的参数,干了微调 100% 的活,尤其在低数据和泛化场景下大放异彩!✨ 🌟。

文章图片
#人工智能
Claude推出教育模块,赋能高等教育变革

Claude for Education模块的推出,是AI技术在教育领域应用的又一重大突破。它不仅为高等教育带来了更加智能的教学体验,还为个性化学习和教学资源的智能生成提供了强大的支持。随着教育智能化的深入发展,未来Claude有望成为更多教育机构的得力助手,帮助学生实现自我超越,助力教师的教学创新,推动教育行业向更加智能化、个性化的方向发展。

#人工智能
到底了