logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ACoT-VLA:让机器人用动作思考——CVPR2026

摘要: 北航与AgiBot团队提出的ACoT-VLA框架创新性地将机器人推理过程从语言/视觉空间转移到动作空间,通过**显式动作推理器(EAR)生成粗粒度轨迹与隐式动作推理器(IAR)**提取行为先验,直接以动作序列指导决策,有效解决传统VLA模型的语义-运动学鸿沟问题。该模型在LIBERO等三大基准实现SOTA,真实机器人任务成功率提升显著。代码已开源,支持快速部署与复现。

文章图片
#机器人#vim
OpenClaw(龙虾)AI智能体部署指南:从本地到云端,小白也能轻松上手

OpenClaw部署其实很简单,一键脚本就能搞定大部分工作。本地部署适合个人使用和测试,云服务器部署适合需要7×24小时在线的场景。如果遇到问题,先查看官方文档或社区讨论,也可以在评论区留言交流。祝你"养虾"成功,让AI助手帮你提升工作效率!

文章图片
#人工智能
ACoT-VLA:让机器人用动作思考——CVPR2026

摘要: 北航与AgiBot团队提出的ACoT-VLA框架创新性地将机器人推理过程从语言/视觉空间转移到动作空间,通过**显式动作推理器(EAR)生成粗粒度轨迹与隐式动作推理器(IAR)**提取行为先验,直接以动作序列指导决策,有效解决传统VLA模型的语义-运动学鸿沟问题。该模型在LIBERO等三大基准实现SOTA,真实机器人任务成功率提升显著。代码已开源,支持快速部署与复现。

文章图片
#机器人#vim
KGGen:用大模型从纯文本中提取高质量知识图谱,解决信息稀疏难题&代码

KGGen通过巧妙地将大语言模型的强大理解能力与传统的语义聚类、去重算法相结合,成功实现了从纯文本到。

文章图片
#知识图谱#人工智能#python
离线部署大模型结合知识库,提取ICD-10编码与诊断信息实践,涵踩坑记录

BM25(Best Matching 25)是一种经典的信息检索算法,是基于Okapi TF-IDF算法的改进版本,旨在解决Okapi TF-IDF算法的一些不足之处。加载DeepSeek蒸馏型 LLM(如DeepSeek-R1-Distill-Qwen-1.5B),通过 “仅从候选列表选择” 的强约束提示(SELECT_PROMPT),让 LLM 在知识库中混合检索的候选中精准筛选出匹配的 IC

文章图片
#人工智能#深度学习#python
多种人脸处理方案——人脸裁剪

为满足不同人脸处理需求,对比 MTCNN、Dlib、MediaPipe、OpenCV 四种方案:MTCNN 高精度检测定位,适用于人脸对齐等;Dlib 可 68 点精细定位,用于人脸分析等,但速度慢且依赖模型;MediaPipe 轻量跨平台,适合实时视频等,不过关键点精度稍低;OpenCV 速度快易用,用于快速原型等简单场景,然精度最低且依赖人工调整 ,各方案优势、劣势与适用场景有别,可按需选用。

文章图片
#python#机器学习
离线部署大模型结合知识库,提取ICD-10编码与诊断信息实践,涵踩坑记录

BM25(Best Matching 25)是一种经典的信息检索算法,是基于Okapi TF-IDF算法的改进版本,旨在解决Okapi TF-IDF算法的一些不足之处。加载DeepSeek蒸馏型 LLM(如DeepSeek-R1-Distill-Qwen-1.5B),通过 “仅从候选列表选择” 的强约束提示(SELECT_PROMPT),让 LLM 在知识库中混合检索的候选中精准筛选出匹配的 IC

文章图片
#人工智能#深度学习#python
传统组学之Onekey平台记录

相关学习公众号:影像组学工具

文章图片
#机器学习
Kaggle服务器初体验记录

Kaggle给每个用户提供了以下资源,自己可使用私人数据集空间100G,CPU使用时间不限,GPU每周使用时间为41小时,TPUv3-8使用时间为20小时;最后点击两次Save,然后点击左下角图标,弹出如下浮动窗口,并点击浮动窗口最上面的一行后面三个点弹出另一个浮动窗口,并点击Open Logs in Viewer。这里可以选择是否保存输出(每次如果没保存,output中的文件会被清空),同时可以

#服务器#python#运维
到底了