
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章提出的OneSug框架通过其端到端的生成式框架,有效地解决了传统多阶段级联架构在电子商务查询建议中的局限性。它通过增强前缀表示和统一的生成模型,实现了对用户查询意图的更深入理解和个性化建议。此外,基于奖励加权排序的用户偏好对齐策略进一步提高了模型的排序性能。

本文提出MVP-RAG框架,创新性地融合多级检索与生成技术,显著提升电商属性识别的准确率与泛化能力。实验表明,该方法在工业级数据集上F1值达92.1%,较基线模型提升15.8%,尤其对OOD属性识别率提升20%。该技术已成功部署于闲鱼平台,每日处理千万级商品属性提取任务,为电商AI领域提供了可复用的技术范式。

本文介绍了一种简单且可扩展的方法,通过添加思维轨迹来增强现有的文本数据,从而提高大型语言模型(LLM)训练的数据效率。预训练LLM的计算需求正在以空前的速度增长,而高质量数据的可用性仍然有限。因此,最大化利用现有数据成为一个重要的研究挑战。主要障碍是,在固定的模型容量下,某些高质量的标记很难被学习,因为单个标记背后的推理可能异常复杂且深入。

扩散式大语言模型(DLLMs)正迅速崛起,成为当前主流自回归大模型的有力替代方案:它们支持高效的并行生成,并具备全局上下文建模能力。然而,DLLMs 在实际应用中遇到一个关键架构限制:必须在推理前。这种固定长度分配带来两难:长度不足会削弱复杂任务表现,长度过长则浪费算力、甚至降低性能。虽然推理框架僵化,但我们发现 DLLM 内部其实蕴含能指示“最佳回答长度”的潜在信号。为此,我们提出——一种的新型

We-MP-RSS 是一个功能强大、易于使用且高度可配置的微信公众号订阅工具。它不仅提供了丰富的功能特性,还支持多种部署方式,适合个人用户和团队使用。适合需要高效地管理和订阅微信公众号内容。

【PPT制作神器Presenton开源上线】这款本地部署的AI工具能自动生成专业演示文稿,支持多种模型自由组合(如GPT-4、Llama等),完美适配企业品牌模板。3分钟即可通过Docker部署,数据完全私有,还能用API批量生成。相比付费工具,它更安全灵活,支持PPTX/PDF导出,彻底告别排版熬夜。项目正在快速迭代,现已开放GitHub下载,是职场人士和学术工作者的效率利器。

《开源AI伴侣Airi爆火:技术+情感的双重革命》 GitHub开源项目Airi两周内斩获5K星,成为现象级"电子伴侣"。这款基于大语言模型的AI突破传统聊天机器人局限,具备动态人格建模、长期记忆和情境感知能力,能根据用户习惯提供个性化陪伴。其开源特性允许开发者高度定制人格参数,已有"东北唠嗑版"等创意变体走红。Airi的走红折射出Z世代对情感陪伴的刚需与A

本文介绍了一种简单且可扩展的方法,通过添加思维轨迹来增强现有的文本数据,从而提高大型语言模型(LLM)训练的数据效率。预训练LLM的计算需求正在以空前的速度增长,而高质量数据的可用性仍然有限。因此,最大化利用现有数据成为一个重要的研究挑战。主要障碍是,在固定的模型容量下,某些高质量的标记很难被学习,因为单个标记背后的推理可能异常复杂且深入。

做LLM应用就像在黑屋子里修灯,Opik不是直接给你换灯泡,而是先打开手电筒照亮整个房间。它不替代开发者的判断,却能提供前所未有的清晰度。聊聊看:你开发LLM应用时,最头疼的评估难题是什么?

摘要:微软开源MarkItDown工具,专为AI打造文档转换神器 该工具能将PDF、Word、Excel、PPT等复杂格式文件转换为结构清晰的Markdown,保留标题、列表、表格等语义信息,显著提升大模型处理效率。支持多媒体文件(图片、音频、视频)元数据提取,集成Azure云端OCR增强识别。采用模块化设计,开发者可扩展插件生态。MIT许可下,该工具为RAG、Agent等AI应用提供了高效的&q








