
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文来源公众号,仅用于学术分享,侵权删,干货满满。小目标一直是目标检测的一个痛点,本文为大家介绍一种小目标检测方法ESOD,它是一个通用框架,可以应用于基于CNN和ViT的检测器来节约计算和GPU内存成本。实验证明在VisDrone、UAVDT和小型行人数据集上,作者的方法一致性地大幅度超越现有技术水平。论文链接:https://arxiv.org/abs/2407.16424代码链接:https

最近,通义开源的QwQ-32B模型可谓是火的一塌糊涂。作为一个中型推理模型,QwQ-32B只有320亿参数,但却在多个基准测试中展现出优秀的推理能力,几乎直逼满血版DeepSeek R1,在数学计算、写作与代码编程方面的表现更是相当不错。最重要的是,QwQ-32B不仅性能强大,还极其“亲民”,它体积小、推理快,支持消费级显卡部署,像RTX 4090这样的显卡就能轻松运行,非常适合普通个人开发者或者
SuperDesign是一款集成在IDE中的AI设计工具,能通过自然语言描述自动生成UI界面和组件代码。它支持VSCode、Cursor等主流开发环境,可一键导出设计为可复用组件,实现"即写即画"的高效开发体验。该工具开源免费,兼容多种AI模型,显著减少设计开发切换成本,模糊设计与开发界限,代表AI原生开发的新趋势。对于独立开发者和小团队,能大幅提升从需求到实现的效率。

这次带来 RAG 的小白应用教程:介绍如何通过 ragflow 框架把 DeepSeek 接入到自己的个人知识库中,当然其他模型也是类似,可以自由搭配。

归一化长期以来一直被认为是必不可少的,在现代神经网络中无处不在。但团队认为可以换用一种非常简单的技术,他们提出(Dynamic Tanh),直接替代Layer Norm或RMSNorm,性能达到或超过标准Transformer。从视觉的ViT/MAE,到语言模型的LLaMA,再到语音、DNA系列等模态都可以用,完整代码库已开源。网友评价说,只要元素级运算就能实现和归一化一样的效果,这对于效率优化来

该方案不仅结合了Deep Research的优势,在此基础上,用户还能自由选择底层大模型,并通过Milvus接入本地数据,更适合企业级场景落地。

检索增强生成(Retrieval-Augmented Generation, RAG) 是一种结合了信息检索和大模型(LLM)的技术,用于构建更强大和准确的问答或生成系统。RAG通过将大模型与外部知识库相结合,可以动态检索相关信息并利用生成模型对查询进行更准确的回答。

本⽂探讨推理型⼤语⾔模型的构建⽅法,涵盖其定义、优缺点及 DeepSeek R1 的训练策略。重点解析四种增强推理能⼒的⼯具:推理时扩展、强化学习、监督微调+强化学习、蒸馏。并探讨 LLM 未来趋势及低预算训练策略,助力AI 研究者更有效地开发推理型模型。

Kaggle赛题解析:使用大模型绘制SVG图像赛题名称:Drawing with LLMs赛题类型:大模型、文生图大模型赛题任务:通过大语言模型生成SVG格式的图像本次任务的目标是根据给定的文本提示生成SVG(可缩放矢量图形)代码,尽可能准确地将其渲染为图像。参与者需要利用Kaggle新推出的“Kaggle Packages”功能来构建提交内容,这是一种用于构建可复用模型的Python库工具。为了

浙江大学与港大团队提出PriorDepthAnything框架,将稀疏深度传感器数据与AI深度预测相融合,实现一键补洞、降噪和分辨率提升。该创新方法通过粗到细的流程整合度量信息与几何结构,支持7个真实数据集的零样本迁移,可处理深度补全、超分辨率和修复任务,并能直接优化VGGT等3D模型输出。实验证明该方法在保持像素级精度的同时,显著提升了深度图的细节、边界和度量准确性,为自动驾驶、AR/VR和工业








