登录社区云,与社区用户共同成长
邀请您加入社区
本文介绍了3D开发中常用的基础数据类型及其应用场景。主要内容包括:二维向量(Vec2)用于屏幕坐标和UV纹理;三维向量(Vec3)表示位置、方向、缩放等;四维向量(Vec4)用于颜色和齐次坐标;四元数(Quaternion)作为旋转的最佳表示方式,避免了欧拉角的万向节锁问题;颜色(Color)的RGBA表示;轴对齐包围盒(Aabb)用于碰撞检测;矩形(Rect)表示平面区域;以及4x4矩阵(Mat
但是,无论是Mesh、Voxel和点云的时代,不要忘了,**大部分的内容都是程序员/美术给你定义好的,就像游戏,程序和美术都给你写好了,每个人体验的几乎一样,都会有玩腻的时候。背后是3DGS技术经过了2年多的快速演进,已经进入到了一个快速发展期,它不在是一个新的图形表达,类似Mesh、Voxel、Point等,而是在AI的大环境下,一种可以快速建模、生成、渲染,可微分的形成快速闭环链路的表达。为什
展示一个由小正方体搭建的3D立体模型,学生可以通过手指滑动屏幕旋转模型,并点击不同视角按钮(前面、上面、左面),应用显示对应视角的平面图形,培养空间想象力。const names = [‘’, ‘前面’, ‘后面’, ‘右面’, ‘左面’, ‘顶面’, ‘底面’]return names[this.currentFace] || ‘未知’:能辨认从前面、上面、左面观察到的几何体的形状。Text(‘
HarmonyOS7更新亮点实录43:Spatial Recon Kit 深度实践,3DGS 渲染管线深度编辑与 2D 图片的三维空间感重构
使用LangChain、LangGraph自校正智能体与管理流程构建智能RAG系统;使用CrewAI、微软AutoGen与微软智能体框架构建多智能体RAG;使用Docker将RAG智能体部署至AWS ECS Fargate、GCP Cloud Run、Azure、Railway与Render平台;希望实践多智能体框架的AI工程师;课程以检索增强生成(RAG)为核心,从零搭建生产级RAG工具套件,从
本文针对Web3D项目中GLB/glTF模型加载速度慢的问题,提出了五步优化方案:首先通过Chrome DevTools诊断瓶颈;其次使用Draco/Meshopt压缩模型;第三步采用KTX2格式优化纹理;然后调整Three.js加载配置;最后拆分场景并利用CDN缓存。这些措施可显著降低加载时间至2秒以内,解决大模型加载慢、移动端体验差和页面白屏等问题,提升用户留存率。
26年6月来自跨维智能(DexForce Technology)和港中大深圳分校的论文“Dexterity-BEV: Aligning 3D World and Actions for Generalizable Robot Policies Learning”。端到端操作策略结合网络规模预训练的视觉-语言模型(VLM),展现了实现通用且灵巧的机器人操作的潜力。然而,它们继承了二维基础模型的两个主
本项目基于YOLOv11深度学习框架,开发了一套高效的3D打印缺陷识别检测系统Spaghetti(杂乱堆积)、Zits(表面凸点)、Stringing(拉丝)。系统采用PyTorch框架训练优化模型,结合YOLO格式标注数据集,确保高精度检测能力。此外,项目提供了完整的Python项目源码,并配备了用户友好的UI界面,支持登录注册功能,便于用户管理和使用。系统在训练集(4,696张)、验证集(58
PointPillars是一种高效的3D目标检测方法,适用于自动驾驶和机器人LiDAR感知任务。其核心创新是将稀疏点云转换为BEV伪图像:在XY平面划分柱体(pillar),每个pillar覆盖整个高度范围,避免了3D卷积的计算开销。方法流程包括:点云范围裁剪、pillar划分、通过PointNet编码pillar特征、散射为BEV伪图像,最后使用2D CNN进行检测。相比传统方法,PointPi
摘要: 本文系统构建了严格SO(3)等变的球谐图神经网络(SH-GNN),通过群表示论与泛函分析的深度交叉,实现了从格点QCD诊断工具到跨维度统一深度学习框架的跃迁。核心贡献包括: 数学基础:从拉普拉斯方程导出球谐函数的完备正交性,建立三对角递推的数值稳定算法; 等变架构:证明三行代码实现的消息传递算子(1D/2D/3D同构)满足严格的SO(3)等变性,其动态稀疏截断误差受Parseval恒等式约
本文介绍了一种基于单目相机和已知平面约束的工业视觉定位方法。该方法通过将图像像素点反投影为相机坐标系下的射线,结合手眼标定和机器人当前位姿,将射线变换到机器人base坐标系,再与已知工作平面求交,最终确定目标点的三维坐标。该方法适用于目标点位于稳定平面的工业应用场景,如焊接定位、孔位识别等。核心流程包括像素去畸变、射线变换和平面求交三个步骤。虽然单目相机无法直接测量深度,但通过引入平面约束,可以有
深度估计的核心任务,是从输入的二维图像 I ∈ R^(H×W×3) 中,预测对应的深度图 D ∈ R^(H×W),其中每个深度值 d_ij 表示图像像素 (i,j) 到相机的物理距离。这个看似简单的映射关系,却是计算机视觉中最基础也最困难的问题之一。深度图本身是一种极为丰富的信息载体。在自动驾驶场景中,深度图告诉系统前方车辆是50米还是100米;在增强现实中,深度信息决定了虚拟物体应该被放置在真实
本文系统阐述了3D成像技术中的相机模型,将其拆解为几何成像、辐射度量和光子转移三大核心模块。首先介绍了相机的镜头、滤光片和图像传感器三大构成部件及其关键参数。在几何成像模型中,从单透镜成像出发,推导了景深和超焦距公式,并详细解析了计算机视觉中的针孔模型和Brown畸变模型。文章还探讨了辐射度量模型和光子转移模型,全面揭示了从3D场景到2D图像的几何映射、辐射传递和灰度转换过程。这些模型对3D测量系
上一篇我们把智能生活助手的首页跑通了,今天来搞点酷的——给商品加一个 3D 展示功能。用户对着商品拍几张照片,App 就能在端侧重建出 3D 模型,然后 360° 旋转查看。这背后就是 HarmonyOS 7 引入的端侧重建技术。
本文介绍了一款300mm单片湿法清洗设备的技术参数与维护要点,设备搭载8个工艺腔体,理论产能300片/小时,支持SPM、SC-1等药液体系,配备精密温控和动态直喷系统。二手设备需定期维护药液阀组、校准传感器并检测关键部件。整机兼容65-45nm制程,适用于量产与研发。文末声明数据来源于官方资料,仅作技术参考,不承担商业用途风险。
React Three Fiber是一个将Three.js与React结合的3D渲染库,它通过JSX语法映射Three.js的API,使开发者能够用声明式React组件构建3D场景。该库支持完整的Three.js功能,提供高性能渲染,并与React状态系统深度集成。安装简单,支持TypeScript和React Native,拥有丰富的生态工具链(如drei、rapier等),适用于产品展示、数据
HarmonyOS 5的DeviceProfile与动态LOD模型切换方案,为3D应用解决了「高端机性能过剩、低端机体验拉胯」的痛点。通过「硬件检测-策略匹配-模型切换」的闭环流程,开发者无需为不同设备重复开发,即可让3D应用在全场景设备上流畅运行。
LayaAir是业内率先支持HarmonyOS-PC的游戏引擎,目前已有多款基于LayaAir-Native打包的鸿蒙平台应用成功上线,包括《斗罗大陆》、《一刀传世》、《猛鬼宿舍》、《君临传奇》等大型游戏,充分展现了引擎在原生性能和平台适配方面的优势。LayaAir引擎的全平台3D引擎定位、超百万的开发者用户基础、平台合作伙伴、使用引擎的知名企业、引擎特点、知名引擎案例等情况后,还重点介绍了。Je
在拍摄阶段,Remy通过AR Engine获取Camera图像数据和每一帧图像对应的相机位姿(Pose),基于这些数据,应用将当前拍摄覆盖情况实时可视化显示在轨迹球(Trajectory Ball)上,直观引导用户补充未拍摄区域,避免视角缺失或重建不完整的问题。HarmonyOS SDK未来将继续通过AR Engine为开发者提供稳定、易用的AR与空间计算能力,助力更多应用在移动端探索3D、AR与
Remy是一款基于3D重建技术开发的空间记录应用,用户只需使用手机摄像头进行环绕拍摄,即可像录制普通视频一样,生成沉浸式3D空间模型,捕捉生活中的真实三维瞬间。在拍摄阶段,Remy通过AR Engine获取Camera图像数据和每一帧图像对应的相机位姿(Pose),基于这些数据,应用将当前拍摄覆盖情况实时可视化显示在轨迹球(Trajectory Ball)上,直观引导用户补充未拍摄区域,避免视角缺
安装uv包管理器 → Blender安装addon插件 → Cursor配置MCP服务 → 启动连接并测试。只要严格按照步骤操作,就能在10分钟内完成整个部署,让你的Blender拥有AI原生创作能力。
Spatial-TTT最值得关注的,不只是一个2B模型在多个空间智能基准上的领先成绩,它还提供了一种重新理解长视频记忆问题的方式。传统长上下文方案试图保留更多历史内容,Spatial-TTT则进一步追问:模型能否将持续到来的视觉观察,转化为一份能够不断更新、修正和调用的内部空间状态?它不需要永久保存每一帧画面,却需要知道自己经过了哪里、看到了什么,以及空间关系如何随着新的观察发生变化。这对于真正进
打开账单,那个 AI 知识库会员又扣了三百多块。不多,但每次看到这笔钱,我心里都会冒出一个念头:这个月我打开过它几次?答案是:不超过三次。而且其中两次搜出来的东西,说实话,不太对。每个月续费的时候我都会犹豫一下。打开账单,那个 AI 知识库会员又扣了三百多块。不多,但每次看到这笔钱,我心里都会冒出一个念头:这个月我打开过它几次?答案是:不超过三次。而且其中两次搜出来的东西,说实话,不太对。这就是我
本文系统讲解了HarmonyOS 3D图形渲染的基础知识,从坐标系统体系到变换矩阵原理,再到完整的代码实现。
如果你是一名前端开发,你一定知道——做一块数据大屏要多久?传统方式:设计稿 → 切图 → 搭场景 → 调材质灯光 → 写交互 → 接数据 → 反复修改 → 交付。3D 大屏更复杂,Three.js 的坐标系、材质、光照每一项都能让你 debug 一整天。一个熟练的 Three.js 开发,做出本文这个效果,保守估计 3~5 天。
这篇文章介绍如何利用AI提示词快速生成一个交互式3D中国地图,无需编码基础。核心步骤包括:通过GeoJSON获取地理数据,使用d3-geo进行墨卡托投影转换,用Three.js将平面轮廓挤出为3D立体块,并添加鼠标交互功能。文章提供了完整的AI提示词模板,包含数据源地址、功能需求和技术要求,可直接用于Claude或ChatGPT生成可运行的HTML文件。实现效果包括:可旋转缩放的3D省份地图、悬停
打断后数字人能够理解用户的新问题并给出针对性回答,支持中途再次打断,实现真正的双向对话。用户可以通过纯语音与常驻的 3D 职场高管导师数字人顾言进行面对面的高压沟通对练,数字人能够以顶尖组织心理学专家的姿态,实时响应用户在职场中遇到的社交痛点,一次性提供极具杀伤力的高情商话术策略,开展全自动的连续模拟特训。同时,AI Coding 工具的加持让整个开发过程效率倍增——从 UI 布局、动画效果到大模
OpenAI疑似泄露GPT-5.6测试版本,引发AI圈震动。该模型展现出三大突破性升级:1.5M Token的超长上下文窗口、多Agent协同推理能力显著提升,以及性价比优势。实测显示,其在3D建模和游戏生成方面表现惊艳,能精准处理复杂空间关系和动态光影效果。文章通过代码示例展示了其推荐架构,并建议开发者适应Agent协作模式,善用长上下文优势。面对OpenAI的快速迭代(约每7周更新旗舰模型),
本文介绍了基于鸿蒙OS开发的3D盲盒贴纸App的设计与实现。项目采用ArkTS语言,核心功能包括: 盲盒抽卡系统: 设计5级稀有度(普通/稀有/史诗/传说/隐藏款) 3种盲盒类型(免费/白银/黄金)采用分层概率算法 实现贴纸重复计数与新收集检测机制 数据管理: 使用Map结构存储用户收藏 通过Preferences实现数据持久化 采用JSON序列化处理复杂数据结构 交互设计: 3D卡片旋转动画效果
本文完整记录Windows环境下CLI-Anything对接Codex与本地Blender的全流程部署方案。先梳理本地软件路径,分步完成Codex技能安装、Blender环境变量配置、Blender CLI工具与cli-hub管理工具部署;针对Windows特有中文路径编码、路径反斜杠转义、控制台GBK解码、无软链接权限四大兼容问题修改源码修复;搭建完整渲染链路完成多层功能验证,同时给出场景创建、
摘要 本文基于HarmonyOS的ArkUI框架,详细解析了如何实现一个高度拟物化的3D银行卡交互模块。通过声明式UI和强大的动画系统,开发者可以轻松构建具有空间感、物理惯性和点击翻转效果的虚拟信用卡。文章从数据模型定义、交互状态机设计、手势映射算法到动画编排逻辑,进行了全方位的技术拆解。核心内容包括: 数据模型与状态机:定义了银行卡的业务属性,并建立了控制卡片平移、旋转和翻转的交互状态机。 手势
第一类是传统3D软件集成AI插件的方案,这类工具在Blender、Maya等专业软件基础上嵌入AI生成模块,优势是与现有工作流兼容性较好,但对用户的3D基础知识要求仍然较高,且需要在多个软件间切换完成从建模到动画的全流程。第三类是一体化AI创作平台,代表性产品如V2Fun,将AI生图、AI建模、纹理生成、自动重拓扑、骨骼绑定与动画制作集成在同一平台内,减少了反复导入导出的步骤,有助于提升复杂构图的
3d
——3d
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net