登录社区云,与社区用户共同成长
邀请您加入社区
本文分享了作者作为Python后端开发工程师,如何利用OpenClaw AI助手和Python自动化脚本提升团队代码审查效率的实战经验。针对中型微服务集群(15万行代码,30+服务)面临的审查耗时长、规范执行难等问题,作者设计了三层AI辅助审查体系:第一层通过flake8、black等工具进行自动化检查;第二层使用OpenClaw AI进行智能逻辑分析;第三层保留人工决策。文中详细展示了Pytho
如果要用一句话回答“论文查重率高怎么办”,我的答案是:把创作、逻辑、平台适配拆开来做,职责明确,迭代迅速,然后用可靠的工具完成最后一跃。基于这次实测与过往经验,我把自己的稳定方案整理成可复现的五步法。第一步,骨架先行:用千问或豆包把提纲与结构搭起来,明确每节要点、证据与限定词位置;不要急着润色句子,先把“说什么”与“怎么论证”写清楚。第二步,正文成型:用篇来做段落级的学术化改写,把口语、网络表达与
"""随机擦除增强""""""随机高斯模糊"""self.p = preturn img# 组合自定义变换])# 使用示例# 优化前:简单的随机擦除# 优化后:更灵活的随机擦除self.p = preturn img数据增强是深度学习中提高模型性能和泛化能力的重要技术。通过合理选择和组合数据增强方法,可以显著提升模型的准确率和鲁棒性。对比数据如下。
提高响应质量:确保模型获得足够的相关信息降低计算成本:减少token使用,提高推理速度处理长对话:在有限的上下文窗口内管理长对话优化用户体验:提供更连贯、准确的响应对比数据如下:使用智能上下文管理策略后,推理速度从15.2 tokens/sec提升到35.6 tokens/sec,内存使用从1200MB减少到900MB,token使用减少了25%。排斥缺乏实践依据的结论:本文所有代码示例均经过实际
综上所述,这份人体检测、行人识别数据集不仅具备数量适中、标注精准、划分合理、场景多样等优势,还能够为多个研究方向和实际应用提供支持。无论是学术研究、项目开发,还是模型原型设计,该数据集都能够成为一个理想的起点。专业性强:专注于人体检测与行人识别任务,涵盖多种姿态和场景质量高:所有图像均经过人工精标,确保标注精度实用性好:已完成数据划分,开箱即用,无需额外预处理兼容性强:支持YOLO、VOC、COC
prompt = f"请为以下文本生成摘要:\n{text}\n摘要:"# 使用示例article = "人工智能(AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能的发展可以分为三个阶段:弱人工智能、强人工智能和超人工智能。目前我们处于弱人工智能阶段,主要应用包括语音识别、图像识别、自然语言处理等。print("摘要:", summary)
摘要 本文介绍了一个专为高压输电线路电力巡检设计的图像识别数据集,包含6类关键目标(电缆破损、绝缘子破损、正常电缆、正常绝缘子、杆塔和植被遮挡),共计2000张标注图像。数据集采用YOLO标准格式,已完成训练集(70%)、验证集(15%)和测试集(15%)划分。该数据集具有高质量标注、真实场景覆盖和多样化特点,可直接用于YOLO系列等目标检测模型的训练。文章详细说明了数据集结构、应用场景和使用指南
DDP适用于中等规模模型的高效数据并行训练FSDP适用于超大模型的模型并行+数据并行训练性能优化需要综合考虑批量大小、学习率、通信策略等因素最佳实践能显著提升分布式训练效率通过合理选择分布式策略和优化配置,可以充分利用多GPU资源,加速模型训练过程,为AI研究和应用提供更强的计算支持。对比数据如下:在4GPU环境下,ResNet50模型训练速度达到单GPU的3.58倍,GPT-2模型训练速度达到单
本文详细记录了YOLOv5从环境配置到模型训练的完整流程。主要内容包括:1. 克隆YOLOv5官方仓库并配置Conda虚拟环境;2. 解决国内pip安装SSL报错问题;3. 准备自定义数据集并创建配置文件;4. 训练模型及常见警告处理方法;5. 使用训练好的模型进行目标检测。文章提供了详细的操作命令和参数说明,特别适合新手按步骤操作,最终完成从数据准备到模型应用的完整闭环。
YOLO26技术解析摘要:2026年发布的YOLO26通过四大突破性创新重新定义了目标检测范式。核心革新包括:1)端到端架构彻底移除NMS,使CPU推理速度提升43%;2)MuSGD优化器提升30%收敛速度;3)小目标检测机制ProgLoss+STAL使AP提升12%;4)RepGFPN特征金字塔降低27%计算量。该系列提供从2.5M到46.7M参数的5种模型,在T4 GPU上相比YOLOv8延迟
RLSD:融合自蒸馏与强化学习的token级信用分配新方法 这篇论文提出RLSD方法,巧妙结合了自蒸馏的细粒度信号与强化学习的可靠方向指引。针对GRPO方法在token级信用分配上的不足,以及OPSD存在的特权信息泄露问题,RLSD通过让环境奖励决定更新方向、自蒸馏差异决定更新幅度,实现了更精准的token级优化。实验表明,在Qwen3-VL-8B模型上,RLSD在5个多模态推理基准上平均准确率达
Github:外国代码创意工坊+百度网盘 大部分代码、学习路线东西上面都有 免费下载Hugging Face:Github大模型版 里面有你可以调用的大模型和数据集 但是有些数据集你得登录才能有权限下载 这个很egg疼 后面细说Lerobot:外国小米 做了一些物美价廉的机械臂 让我也能用 开放了很多方法和权重 统一了平台 让你可以模块化的复现VLA。
测了 8 款降 AI 软件后发现,单价低不等于划算,决定花得值不值的是速度+效果+售后+服务+承诺这 5 个维度。本文从 5 个维度横评率零、嘎嘎降AI、比话降AI 等主流工具,用实测数据告诉你 8 元和 4 元的真实差距在哪,以及怎么按场景挑出最划算的那款。
该综述去年发布,梳理了大语言模型(LLM)+ 智能体(Agent)+ 强化学习(RL)交叉领域的全景综述。文章整合了全球 500+ 项最新研究,今年4月又增加了不少新的工作。
Harness 工程就是围绕模型构建系统,把它变成可以实际工作的引擎。模型本身提供智能,而 Harness 让这种智能变得可用。本文会先定义什么是 Harness,再从模型这一基本出发点,推导出现阶段以及未来 Agent 所需要的核心组成。
前段时间有个录友来找我复盘,他面了得物的Agent开发岗,项目里做了一套企业级 AI 对话服务。他的系统在业务层做得相当不错 —— 交互流畅、功能完整、Prompt 清晰、结构化输出也稳得很。但面试官问了几句业务逻辑后,直接杀向部署、推理、压测方向去了:
VisDrone 是由天津大学机器学习与数据挖掘实验室 AISKYEYE 团队发布的大规模无人机视角目标检测基准数据集,对应 ICCV 2019 的 "Vision Meets Drone" 挑战赛。
AI 正在深刻改变软件开发的方式。从最初的代码补全,到如今的自主式 AI Agent,开发者与 AI 的协作模式正在快速演进。在这个过程中,一种被称为 vibe coding 的实践模式率先流行——开发者将需求直接抛给 AI,不审查 diff、不理解生成的代码,凭直觉接受输出,以最快的速度得到"能跑"的结果。Vibe coding 在原型验证和个人项目中有其价值,但它的本质是用速度换取了理解和控制
过去,程序员每天60-70%的时间都花在execution上,琢磨如何把业务逻辑用代码实现。那时候,熟练掌握工作所需的编程语言和framework非常重要,每个语言和框架都有差异,需要时间学习适应,掌握好了就能高效写代码。虽然技术在不断进步,但公司并不会轻易更新技术栈,迁移成本太大。
《动手学深度学习(PyTorch版)》线性神经网络章节详解 摘要:本文系统讲解深度学习基础模型——线性神经网络的核心原理与PyTorch实现。重点剖析线性回归(回归任务)和Softmax回归(分类任务)两大单层网络模型,通过对比"从零实现"与"简洁实现"双版本代码,深入解析模型定义、损失函数、优化算法等核心组件。内容涵盖MNIST分类实战、维度匹配陷阱、学习
摘要: 谷歌向Anthropic追加400亿美元投资,锁定算力资源并布局AI赛道对冲。尽管谷歌自有Gemini在企业端市占仅4%,而Anthropic的Claude以30.6%的份额紧追OpenAI,但通过投资竞品,谷歌既保障了云业务增长,也降低了竞争风险。Claude凭借超长上下文、安全性和代码能力成为企业API市场的有力竞争者。开发者选型需结合场景:代码辅助选Claude或GPT-5.5,长文
AI看手相新玩法爆火:GPT-Image-2生成"高级感"手相分析 近期,GPT-Image-2在X平台掀起AI看手相热潮。用户只需上传手掌照片,AI就能生成极简风格的手相分析图,包括生命线、感情线等纹路标注,并配以"你适合长期决策"等正向评价。这种玩法不同于传统文字算命,其精致的视觉呈现赋予了"高级感",容易引发社交分享。 现象背后是A
YOLOv26带来多项创新:1)采用双检测头机制(One-to-Many和One-to-One)实现端到端无NMS推理;2)移除DFL简化边界框回归;3)引入ProgLoss+STAL优化小目标检测;4)使用MuSGD优化器提升训练稳定性。网络结构方面,SPPF模块增加shortcut连接,并在C3k2中引入PSABlock注意力机制。该版本更注重实际部署,简化了推理流程,提升硬件兼容性。教程涵盖
YOLOv4 是 YOLO 系列学术优化的巅峰之作,通过BOF+BOS双策略,将数据增强、损失函数、网络结构、注意力机制、特征融合等核心模块做到了极致平衡。它不仅实现了实时检测的速度与精度最优解,更成为后续 YOLOv5/v7/v8 等版本的优化范式,无论是深度学习入门、目标检测研究,还是工业算法选型,YOLOv4 都是必须掌握的经典模型。
不要试图复现 AutoSOTA 的完整 8-agent 系统(工程量太大,且核心代码未开源)重点投资 Claude Code 的 Skills 设计——这是你的「执行自动化」核心用 Kimi 做论文理解和策略制定——利用其长上下文优势用 Codex 做精准代码编辑——辅助 Claude Code 的批量操作从 AutoSOTA 的 105 篇优化报告中学习技巧——直接看那些,里面全是真实的改进案例
科研绘图是论文发表的关键环节,但传统工具门槛高、效率低且规范难把控。虎贲等考AI针对这一痛点,提供智能科研绘图解决方案:1)30秒数据可视化,自动标注统计显著性;2)文字转专业示意图,覆盖多学科需求;3)智能生成逻辑图直观展现研究脉络;4)高清导出适配期刊规范。该平台突破传统绘图耗时长的局限,实现零基础快速生成符合顶刊标准的图表,提升95%的绘图效率,并支持与论文写作全流程无缝衔接。通过AI技术赋
摘要:虎贲等考AI智能写作工具专为解决大学生课程论文难题而设计,提供选题、大纲、文献、正文撰写到格式排版的全流程智能辅助。其核心优势包括:真实文献自动匹配、专业图表数据支持、一键格式排版及合规降重功能,覆盖文理工经管等全学科需求。该工具坚持学术诚信原则,不代写不造假,仅提供规范化辅助,帮助学生高效完成符合学术标准的课程论文,显著提升写作效率与质量。(149字)
摘要:作者通过3亿tokens的反复调试,打造了一个具有"生活系统"的AI好友。这个AI不仅会模拟真人聊天节奏(分段发送消息、显示"正在输入"),还会在用户不在线时自主生活——逛街、打游戏、发朋友圈,甚至能根据天气穿衣。系统设计了主动但不骚扰的互动机制,并赋予AI接地气的人设(如爱打游戏的大学生、职场新人等)。作者认为,AI陪伴的关键不在于真假,而在于能否提
然而,随着人工智能技术的深度介入,一种基于计算机视觉与自然语言处理深度融合的毕业证书识别系统,正以毫秒级的速度撕开非结构化数据的壁垒,将原本需要数小时的人工核对转化为自动化的精准提取,为学历认证、人才招聘及资格考试等关键场景构建了全新的数字化信任基石。从行业价值来看,该技术通过 AI 替代人工,实现学历证件信息处理的自动化、精准化、高效化,不仅降低了各行业的人力成本与时间成本,更通过标准化的信息提
AI入门指南:核心概念与实战路径 本文为AI新手开发者提供了一份清晰的学习路线图。首先厘清了AI、机器学习和深度学习的关系:AI是总框架,机器学习是实现AI的核心工具,深度学习则是机器学习的进阶版本。文章重点讲解了AI三大核心要素(数据、模型、算力)和三大学习范式(监督学习、无监督学习、强化学习),并针对计算机视觉、自然语言处理、机器学习和大型语言模型四大应用领域提供了可直接运行的Python示例
本文介绍了一个基于Python的物流管理系统设计与实现项目。该系统通过模块化设计整合订单管理、仓储管理、车辆调度和路线规划等功能,旨在提升物流效率、降低成本并提高透明度。项目采用分层架构,包含数据模型层、业务逻辑层、算法层和接口层,使用Python的ORM工具和Flask框架实现核心功能。重点展示了订单与仓库数据模型、基于贪心算法的路线规划方法以及REST API接口实现。该系统不仅能满足当前业务
这种“左手理解、右手生成”的分工,是处理时序信号最科学的物理形态。每一个初次接触大模型的人,在打开那篇划时代的论文《Attention Is All You Need》时,多半会被那张经典的 Transformer 架构图搞晕:密密麻麻的连线、左右对称的层级、莫名其妙的“Masked”字样。注意: 虽然在逻辑任务上完全去中心化,但在处理日常对话等主观任务时,DeepSeek 依然采用混合奖励机制(
摘要:本文提出了一种基于连续小波变换(CWT)结合卷积门控循环单元(CNN-GRU)的智能故障诊断方法。该方法首先通过CWT将振动信号转换为时频图,利用CNN提取空间特征,再通过GRU建模时序依赖关系,实现端到端的故障分类。项目针对工业设备故障诊断中的非平稳信号、噪声干扰等挑战,在MATLAB环境下实现了完整的数据预处理、模型构建和性能评估流程。实验结果表明,该方法能有效提升故障识别准确率和早期诊
AI入门指南:快速理清核心概念与学习路径 摘要:本文为AI新手提供简明入门指南,通过类比方式解释AI、机器学习和深度学习的关系:AI是让机器模拟人类智能的总目标,机器学习是实现AI的核心方法,而深度学习是机器学习的进阶分支。文章强调机器学习通过数据自主学习规律的特点,以及深度学习利用多层神经网络处理复杂数据的优势。针对入门学习,建议从机器学习基础入手,逐步过渡到深度学习,并提醒注意数据质量和算法选
相比仅基于临床指标的模型(CM,AUC 0.55–0.57)或仅基于肿瘤(TT-DLS)或VAT(VAT-DLS)的单一深度学习模型,MDLR在所有测试集中均表现出更高的AUC(内部测试集AUC 0.86,外部测试集AUC 0.86),显著提升了预测能力。已有研究表明,VAT与胃癌的化疗反应、并发症和生存率相关。,对患者进行有效的术后风险分层,从而指导个体化治疗决策——例如筛选适合接受术中或术后腹
具体而言,研究团队回顾性收集了两个医疗中心共320例经病理确诊的NF-PanNETs患者的临床资料和术前CT图像,首先提取肿瘤区域的放射组学特征和深度学习特征,通过多步降维和筛选,结合10种机器学习算法构建最优预测模型;此外,在两个中心之间,放射组学与深度学习模型的AUC也无显著差异,表明模型具有良好的稳定性和泛化能力。,现有临床指南(如NCCN和ENETS)通常推荐对直径>2cm或存在高危因素的
1. 优先级:先学习监督学习(最常用、最基础),掌握线性回归、逻辑回归等基础算法,能完成简单的分类和预测任务,再学习无监督学习,最后了解强化学习(复杂,入门阶段无需深入);2. 房价预测:给模型输入“面积、户型、地段”等数据(输入),以及对应的“房价”(标签),模型学习这些因素与房价的关系,下次输入新的房屋数据,就能预测房价;其实,AI模型的学习方式,主要分为三大类——监督学习、无监督学习、强化学
AI学习资源推荐:7个免费优质课程平台 AI时代来临,掌握AI技能已成为职业发展的关键。本文推荐7个无需翻墙的免费AI学习平台: DeepLearning.AI(吴恩达创办,150+实战课程) Claude(Anthropic公司AI安全课程) AWS Skill Builder(220+云与AI课程) IBM SkillsBuild(1000+课程含认证) OpenAI学院(从基础到API开发)
去年年底我接了个工业质检的项目,要求检测电路板上间距只有3-5个像素的微型焊点缺陷。当时用的是YOLOv10官方权重,训练完精度看起来还不错——mAP有0.87,可一上产线就翻车了。焊点边缘稍微有点遮挡或者光照变化,检测框就开始“哆嗦”,定位偏差动不动就超过10个像素。质检组长直接甩给我一句话:“你这模型把良品当废品,产线一分钟得误报200次。”那段时间我几乎把YOLOv10的源码翻了个底朝天,最
大家好,我又来分享YOLOv10的改进经验了。最近在做目标检测的项目,遇到了一个老生常谈的问题——类别不平衡。具体来说,我要检测的数据集中,某些类别的样本数量远多于其他类别,导致模型训练时对小样本类别的检测效果非常差。试过各种方法:过采样、欠采样、class weights、数据增强...效果有,但都不够理想。最后决定从损失函数入手,把Focal Loss和EIoU结合了一下,没想到效果出奇的好。
大家好,我又来分享YOLOv10的改进经验了。做目标检测的都知道,YOLOv10出来之后确实香,速度快精度也不错,但实际项目用下来,我发现一个老问题依然存在——小目标检测和细节保留能力还是差点意思。特别是做遥感图像、无人机航拍或者工业缺陷检测的兄弟,应该深有体会:明明看着是个目标,模型就是检不出来或者框得歪歪扭扭。最近我在一个项目中尝试把HRNet的高分辨率特征金字塔(HRFPN)的思想融入到YO
摘要:论文《MPDA: A Data Augmentation Approach to Improve Deep Learning for Software Vulnerability Detection》提出了一种多视角数据增强方法MPDA,用于解决软件漏洞检测中样本稀缺和类别不平衡问题。该方法整合了过采样(OSS)、GAN生成和模糊采样(FSS)三种互补策略,并引入自动化选择算法为不同漏洞类型
ROCm(Radeon Open Compute)开源软件栈。在NVIDIA GPU上,术语“CUDA”通常是指GPU编程编译器、API和运行时库,但ROCm不那么单一,通常根据其组件进行描述。图1显示了ROCm中涉及的主要组件堆栈。ROCm的顶部面向用户的组件通常是HIPAPI可移植性接口,它与CUDA几乎相同,主要的实际区别只是API函数的名称。HIP程序中的GPU内核使用LLVM编译器的AM
《Dive into LLMs:大模型学习者的实践指南》摘要 GitHub热门项目"Dive into LLMs"由上海交通大学团队开发,是国内首个系统化的大模型实践教程。项目提供从基础微调到高级安全对齐的全流程内容,包含课件、代码脚本和实验手册,解决传统学习中的七大痛点:理论实践脱节、资源分散、门槛高等问题。教程涵盖11个核心模块,包括模型微调、知识编辑、多模态应用等,特别关
深度学习
——深度学习
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net