LIUDAN'S WORLD 个人主页

@u012133341

LIUDAN'S WORLD

2022-11-14 18:22:16 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Windows 本地部署 OpenClaw + LM Studio 完整踩坑记录环境：Windows 10 / RTX 3060 12GB / 32GB 内存 / Node.js v24.15.0

问题原因解决npm 安装报错旧版本冲突或缓存损坏+ 重装安全提示选 No误操作选Yes，这是个人使用确认Browse all models 卡死TUI 交互式界面 bug用参数或手动写配置文件模型 ID 不对OpenClaw 缓存或自动匹配通过 API 确认key，手动指定上下文被限制为 16KOpenClaw 默认安全限制手动修改配置文件中的。

#windows #node.js

24 外部规划器集成：当 LLM 遇到符号逻辑——LLM+P、LLM-DP 与 PDDL 转换的混合架构

让我们用最后一张图，把今天探索的所有内容收束起来：fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none;fill:#333;height:1em;外部规划器集成总览错误通过执行中观察变化自然语言问题如: 搭 ABC 积木塔翻译为 PDDL Domain + Problem验证符号规划器输出

#架构 #机器学习

Tree of Thoughts：当LLM学会“分叉思考“——从线性接龙到树状搜索的推理革命

我们先问一个直觉问题：在ToT里，“一个想法”（thought）到底是什么？是像CoT里的一句话，还是更像某种数据结构？一个thought节点是一个"状态"（state），它封装了从问题开始到当前步骤的所有历史。用Yao等人的符号表示：s = [x, z1, z2, …, zi其中x是原始问题，z1到zi是到目前为止生成的中间推理步骤。这个节点不是孤立的字符串，而是部分解的完整快照。Mermaid

#人工智能 #大数据 #算法

17 Zero-shot-CoT：一句“Let‘s think step by step“如何唤醒沉睡的推理能力——从零样本触发式逐步推理到解码空间的概率导航

让我们回到开头那个Roger的网球问题。现在你应该能看懂了：模型不是"变聪明了"——它的权重一点没变。而是走对了路。触发句像GPS导航，把模型从"抄近路"模式（直接跳到答案，容易翻车）切换到"稳扎稳打"模式（强制停靠每个推理站点）。这把钥匙不需要示例（zero-shot），因为它解锁的是预训练时就已经存在的、沉睡的逐步推理模式。如果画成一张最终的总结图。

#深度学习 #机器学习 #迁移学习

当一条路不够走时：Self-Consistent CoT 深度拆解

而三条正确路径的推理方式各不相同：有的先说乘法，有的先说"先算乘法再算加法"，有的用词不同，但它们像多条小溪，最终都汇入了"11"这个湖泊。但就是这个朴素的想法，让 GSM8K 的准确率从 56.5% 飙升到 74.4%，SVAMP 从 79.0% 涨到 86.6%——而且不需要任何额外训练，不需要标注数据，不需要改模型参数。Wang et al. (2023) 在论文中展示了真实的采样路径，你会

#人工智能 #机器学习 #深度学习

Windows 本地部署 OpenClaw + LM Studio 完整踩坑记录环境：Windows 10 / RTX 3060 12GB / 32GB 内存 / Node.js v24.15.0

#windows #node.js

【视觉架构学：注意力、SSM 与生成模型的融合】第四部分生成式视觉与世界模拟第6章视频生成与世界模型

本章给出理论推导、系统设计与工程权衡，旨在为研究者在构建长时序视频生成系统与基于生成式世界模型的控制器时提供可操作的数学与工程指导。下一章将继续深入到“多模态世界模型与符号推理”的主题，探讨如何把视觉-语言-动作统一到同一潜空间并用于高层规划。

#人工智能 #机器学习 #深度学习

第五部分：进阶项目实战

恭喜你！你已经完成了 OpenCV 教程的第五部分，也是最后一部分的进阶项目实战。构建了一个简单的人脸识别系统，了解了从检测到识别的基本流程。利用 OpenCV 的Stitcher类，轻松实现了图像拼接和全景图制作。通过 OpenCV 的 DNN 模块，学习了如何加载和运行预训练的深度学习模型，成功实现了对象检测。这些项目只是冰山一角。计算机视觉是一个广阔而活跃的领域，还有很多更高级的技术和应用等

#目标跟踪 #人工智能 #计算机视觉 +3

OpenCV实战教程第一部分：基础入门

OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习软件库，于1999年由Intel公司发起，现在由非营利组织OpenCV.org维护。OpenCV旨在提供一个共同的基础设施，加速计算机视觉在商业产品中的应用，并推动计算机视觉研究的发展。完全开源和跨平台支持C++、Python、Java等多种编程语言包含超过2500个优化算法全球拥

#人工智能 #python #计算机视觉 +1

【医疗AI】Flamingo: 基于冻结语言模型的深度多模态融合架构实现与分析

随着大型语言模型（LLMs）能力的不断提升，如何高效地将其与视觉感知能力结合成为多模态人工智能的关键挑战。DeepMind 提出的 Flamingo 架构通过在不修改预训练语言模型参数的前提下，引入少量可训练的桥接模块，实现了视觉-语言深度对齐。本文详细介绍了一个完整的 Flamingo 架构开源实现，重点阐述了 Perceiver Resampler 的视觉信息压缩机制、Gated Cross-

#人工智能 #大数据

共 63 条

请选择