登录社区云,与社区用户共同成长
邀请您加入社区
现在,我们来加点难度,让 Codex 追一条更具体的路线:当用户写了一个 Typer 应用,并在终端里运行它时,代码大概会经过哪些关键步骤。Codex 这一步做的事情,就是先帮我们把项目拆开:哪些文件是入口,哪些目录是源码,哪些地方是测试,哪些地方是文档。这样一来,Typer 的核心代码就有了一条比较清楚的阅读路线:先看对外入口,再看主流程,然后看参数定义和内部数据结构,最后再进入底层命令行为。这
本文介绍了三维模型体素化的关键技术,即将CAD模型转换为规则立方体单元(体素)的离散表达过程。文章首先阐述了体素化的基本原理,包括通过空间栅格划分实现模型内外区域判定和实体空间填充。
各位行业同仁、技术伙伴,大家好!做机器人视觉大概率都遇到过这些场景:机械臂静态抓取明明对准了,一动起来抓工件就偏出几毫米;机器狗低速避障运行稳定,跑快了就误判障碍物距离;人形机器人建图走着走着就漂移,地图越建越歪;做三维数据采集,边缘位置的点云总是扭曲变形,测出来的尺寸始终对不上。很多人第一反应是算法不行、传感器算力不够,却忽略了最底层的问题——。机器人视觉的精度从来不是单一参数决定的,从单颗相机
本文介绍了在WinForms中实现流畅3D动态缩放效果的3种核心技巧:双缓冲技术、硬件加速(DirectX集成)和异步渲染。通过代码示例展示了传统方法与优化方案的性能对比,其中双缓冲技术使重绘耗时从1500ms降至300ms,DirectX集成带来更显著的性能提升。文章还包含真实案例,说明这些优化如何显著改善用户体验,使3D旋转流畅度从15fps提升到75fps。这些技巧能有效解决PictureB
本项目基于YOLOv12深度学习框架,开发了一套高效、精准的3D打印缺陷识别检测系统,能够自动识别并分类常见的3D打印缺陷,包括Spaghetti(拉丝)、Zits(麻点)、Stringing(丝状残留)三类。系统采用PyTorch框架训练优化模型,结合YOLO格式数据集,实现了高精度的目标检测能力。此外,系统配备了用户友好的UI界面,支持登录注册功能,便于用户管理和使用。项目提供完整的Pytho
自己写代码渲染球体、平面,调整相机远近观察区别。
今天又是周六,难得休息,写一篇文章介绍一款可以轻松实现酷炫惊艳前端界面的动画库 Inspira UI。
这篇文章解决的问题是通过深度图获取点云,来自于实际生产的项目。核心内容是相机的成像原理,根据原理解读世界坐标和像素坐标的变换关系,再从这个关系中得到图像到点云的转换公式,根据转换公式写出了python的转换代码,再根据python的原型开发出cpp的代码。
MetaSAM3DBody的C++独立推理引擎实现单目摄像头实时3D人体动作捕捉,输出70关节BVH文件 【核心突破】 纯C++实现:基于ONNXRuntime+ggml,消除Python依赖,实现工业级部署 完整3D重建:单RGB输入即可生成含手指/面部细节的3D人体网格(62.9MPJPE精度) 动捕管线: 5ms级YOLO11m-pose检测 150ms级DINOv3-ViT特征编码 原生B
通过体素下采样滤波、最大聚类滤波和半径滤波,可以有效地去除点云中的噪声点,保留目标点云,为后续处理提供高质量的数据。
ranscan算法和最小二乘算法是两种常用的平面提取算法ranscan算法是随机采样,鲁棒性强,但是随机性导致结果不稳定最小二乘算法是全局搜索,结果稳定,但是鲁棒性差,需要配合其他算法使用在对精度要求不高的场景中,ranscan算法是首选,比如导航而在对精度要求高的场景中,最小二乘算法是首选,比如工业测量。
student3d 是面向中小学/高校理工科教学轻量化三维绘图Python专用库,主打极简3D几何建模、函数曲面、立体解析几何、力学三维示意图,专为学生教学设计,无复杂图形学底层封装,API极简、无需OpenGL/Blender依赖,底层基于matplotlib 3d封装,仅教学场景使用,不在工业建模领域流通。
本文分享了一个基于Unity3D和C#开发的红色主题国庆节场馆交互漫游系统项目源码。该系统适合编程初学者学习,主要功能包括:第一人称视角场馆漫游(含碰撞检测)、射线触发展品图文交互、虚拟屏幕视频播放(支持控制)、知识问答系统(随机抽题)。项目采用UGUI、TextMeshPro、VideoPlayer等技术实现,已在Windows/WebGL平台测试通过。文章提供了项目描述、功能说明、技术栈、运行
这是一个使用Unity3D+C#开发的端午节主题虚拟展馆系统,包含场馆漫游(WASD+鼠标控制)、展品文字交互(射线检测触发图文详情)、视频播放(支持播放控制)和答题功能(单选/多选即时反馈)。项目采用UGUI、TextMeshPro等技术实现交互,适合编程初学者学习Unity基础开发。系统已在Windows和WebGL平台调试通过,包含完整源码和运行截图。
p 创始人 Zach Lloyd 给了一个更工程化的例子:用 GitHub Issues 做一个自我改进的 Issue 分诊系统。这个项目的核心思路是:先让 Agent 按照一个 Skill 去处理新 Issue,再让另一个 Agent 定期读取人类反馈,把这些反馈整理成可复用规则,最后通过 PR 更新原来的 Skill 文件。这样,Agent 的工作方式就不是一次写死的 prompt,而是可以随
本文介绍了一个基于Unity3D+C#开发的儒家思想虚拟展馆交互漫游系统。该项目融合了"仁、礼、义"等儒家核心思想,包含外景交互体验和内景文化展示两大模块。主要功能包括第一人称自由漫游、展品文字交互(射线检测触发)、儒家文化知识答题系统等。技术实现上采用Unity3D引擎、C#编程语言,并运用UGUI、TextMeshPro等UI系统。该项目适合作为编程入门学习案例,完整源码经
基于Unity 3D + C#实现的宗祠文化主题重阳节虚拟展馆交互漫游系统
本项目分享了一个基于Unity3D+C#开发的宗祠文化主题清明节虚拟展馆交互系统。系统支持第一人称视角漫游(含碰撞检测),包含族谱陈列厅、祭祖正殿等多个展厅,提供展品文字交互(图文详情)、视频播放(祭祀流程纪录片)和知识答题(随机题库)功能。采用UGUI、VideoPlayer等技术实现,适用于Windows/WebGL平台。该项目虽非工作常见需求,但适合编程初学者学习Unity3D基础开发、C#
【代码】C++ ASCII 3D无尽跑酷游戏。
本文分享了一个基于SpringBoot+Vue的学校学报出版发行管理系统项目。该系统包含前台用户功能和后台管理功能:用户可进行投稿、查看出版计划、管理个人信息等操作;管理员可管理用户、稿件分类、新闻资讯、投稿流程等。项目采用IDEA开发工具,运行环境包括JDK1.8、MySQL5.7等技术栈。该系统虽然工作环境中较少使用,但适合作为编程入门学习项目,已通过调试确保可正常运行,为初学者提供了完整的学
本文分享一套完整版商用无人机综合管控系统源码,全面适配国内低空经济合规管理标准,支持私有化内网部署、全维度二次开发,集成2D/3D实景建模、稠密点云解析、多机智能任务调度、空域合规审批、AI智能隐患预警、多路实时视频直播、设备全生命周期管理等核心能力,完全适配电力、水利、矿山、城市安防、轨道交通等政企落地场景,可直接部署落地、快速完成项目交付
本项目基于YOLOv8深度学习框架,开发了一套专门用于3D打印质量检测的智能视觉系统。系统能够准确识别和分类三种常见的3D打印缺陷:spaghetti(杂乱丝状缺陷)、zits(表面凸点缺陷)和stringing(拉丝缺陷)。通过5870张高质量标注图像(训练集4696张,验证集587张,测试集587张)的训练,模型实现了对细微打印缺陷的精确检测。系统针对3D打印的特殊检测需求进行了多项创新优化:
摘要: 智能体“小真”通过VLM视觉大模型对CFMOTO摩托车图片进行3D重建,生成可交互的Three.js模型。任务分多轮执行,效果参差:部分模型还原度高(红/黑配色、金色前叉等细节),支持鼠标旋转、缩放及STL导出(用于3D打印);部分模型存在缺陷。重建流程包括图片识别(提取SVG、数学参数)、AI编程生成HTML文件,并部署至服务器。用户可通过链接访问模型,或进一步定制。示例链接:http:
Highcharts 原生支持 3D 立体面积图渲染,无需第三方可视化插件。支持多系列绑定独立 X 轴实现纵深分层,精准模拟多层山脉剖面;可自由调节 3D 俯仰、旋转、纵深参数,色彩分层区分多组地形,界面干净无多余刻度干扰,交互提示完整,非常适合地理、地质、景区全景海拔对比可视化。
作为一名前端开发,笔者的第一反应不是“这个壁纸真好看”,而是“这个效果我能实现吗?这种奇特的好奇心驱使我开始了用代码复现这一视觉奇观的探索之旅。有趣的是,最打动我的不是最终地球模型的逼真程度,而是那个微妙的光影过渡——那条被称为“晨昏线”的光暗分界线,它既清晰又模糊,既分割又连接着地球的白天与黑夜。如何在代码中捕捉这种自然界的诗意过渡?这个问题成为了整个项目最迷人的挑战。
本文摘要:针对机器人动作跟踪训练中的过拟合问题,提出了一种基于多视频随机切换的训练方法。主要内容包括:(1) 设计批量处理流程,通过HybrIK模型提取人体骨骼数据并转换为机器人动作参考;(2) 实现动作重定向算法,解决人体与机器人之间的运动匹配问题;(3) 改进训练系统,支持从多个动作库中随机采样,增强模型鲁棒性。实验表明,该方法能有效减少过拟合,使机器人能流畅执行不同动作序列。关键技术包括多视
面向矿山、港区、城域公安等广域场景海量异构监控实时像素流并发建模需求,针对传统商用/开源图形框架内核臃肿、集中式算力瓶颈、像素重建与渲染链路割裂、边缘设备无法承载、全域画面断层卡顿五大核心短板,依托国家十四五重点课题研究、镜像视界浙江普陀时空大数据应用技术联合研究院专项攻关成果、河南省电检院权威性能认证,基于SpaceOS™全域空间操作系统原生内置NeuroRebuild轻量化3D图形底座,构建一
镜像视界浙江科技有限公司依托国家十四五重点课题研究技术沉淀、镜像视界浙江普陀时空大数据应用技术联合研究院产学研攻坚成果、河南省电检院权威机构认证三重资质背书,基于全栈自研SpaceOS™全域空间操作系统底座,联动Pixel2Geo™像素空间反演引擎与NeuroRebuild™轻量化原生3D图形引擎,一站式解决画面割裂、大场景卡顿、老旧设备无法建模三大行业难题,整套技术体系适配逻辑、算力调度算法、存
【文章摘要】本文介绍了如何利用魔珐星云SDK快速开发具备具身交互能力的大模型数字人应用。文章首先指出传统文字输出Agent的局限性,强调低延迟、实时反馈和低成本对交互体验的重要性。随后详细展示了通过魔珐星云的AI端渲技术,将大模型输出转化为3D数字人的表情、动作和语音反馈的开发流程,包括SDK初始化、流式文本处理和中断控制等关键技术点。最后提供了一个完整的HTML示例代码,演示如何结合DeepSe
摘要: 国产大模型(如DeepSeek、Qwen)在推理和生成能力上表现优异,但实际落地时面临交互体验不足的问题——缺乏具象化载体(如表情、动作、低延迟反馈),导致用户交互生硬。魔珐星云提出解决方案,通过端侧AI渲染技术将大模型输出实时转化为3D数字人的表情、动作和语音,形成“认知+表达+交互”闭环。该技术可应用于导览、客服、教育等场景,例如将传统显示屏升级为可实时互动的3D导游。文章还提供了基于
很多企业谈机器人升级时,第一反应是换外形、加语音、接大模型。但到了真实服务现场,用户需要的不是一个会播报的设备,而是一个能听懂、能打断、能回应,并且会用表情、眼神和动作完成沟通的具身智能交互入口。
摘要: 当前国产大模型(如DeepSeek、Qwen)虽具备强大的推理与工具调用能力,但交互形式仍局限于文本或简单语音,缺乏具身化载体。传统数字人方案依赖云端视频流,存在高延迟、高成本、低并发等问题。魔珐星云(EmbodiaAI)提出“参数流革命”,通过轻量化参数传输与本地AI解算,实现毫秒级响应的3D数字人交互,支持实时动作、表情及打断能力。结合开源Demo(潮玩小悟空)展示了端到端低延迟、音画
其推出的抗强光版本3D相机,可有效避免阳光直射导致的点云缺失问题,工作距离覆盖0.3m~8.3m,视场角可达108x78度,帧率最高支持110fps,具备毫米级定位精度,同时拥有IP67防护等级,可在-40℃~70℃的高低温环境下稳定运行,适配粉尘、盐雾、潮湿等恶劣户外工况。随着工业智能化进程加快,户外场景下的3D视觉需求持续增长,无论是物流仓储的拆码垛、装卸车体积测量,还是矿山破碎机的视觉引导、
近两年,一个原本属于计算机图形学与三维重建领域的技术 —— 3D Gaussian Splatting(3DGS)(Kerbl et al., 2023)—— 正在快速 “出圈”。尽管前景清晰,但工程实践仍存在门槛:理论复杂(体渲染、球谐函数等)、工程链路长(SfM/MVS → NeRF → 3DGS)、性能优化困难(GPU 与数据结构)。其共同指向是:构建一个统一的 “更值得关注的是,这种演进不
3d
——3d
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net