logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【RAG评估】基于LLM的RAG评估综述

本文梳理了RAG评估领域从G-EVAL到最新框架的发展历程。G-EVAL开创性地提出用大语言模型(LLM)作为评估者,通过提示编写、自动生成思维链(CoT)和概率连续化打分三个步骤,显著提升了评估质量。但同时也发现LLM可能存在对同类生成文本的偏好问题。在G-EVAL之后,出现了Ragas、ARES等更精细的评估框架,以及自我修正框架,这些新方法能更精准地诊断RAG系统中检索和生成环节的问题。文章

文章图片
#人工智能#深度学习#机器学习
DeepSeek 提示词大全

提示词(Prompt)是人类与大语言模型进行交互的指令性文本,它告诉模型"做什么"和"怎么做"。好的提示词能够引导模型产生符合预期的输出,就像巧妙的钥匙能打开精密的锁一样。任务:请对以下{文本类型}进行摘要提取内容:{需要摘要的完整内容}摘要要求:- 长度:{字数或段落要求}- 重点关注:{需要特别提取的信息类型}- 结构:{摘要的呈现结构,如"要点列表"、"段落式"等}- 风格:{摘要的语言风格

文章图片
#人工智能#microsoft
Gazebo加载模型与ROS控制

本文介绍了在Gazebo环境中使用ROS集成机器人仿真的关键步骤。主要内容包括:1)创建Gazebo ROS包的文件结构规范,将机器人模型与Gazebo配置分离存放;2)URDF文件格式要求,包括必须包含的惯性参数、Gazebo扩展标签等;3)通过spawn_model服务调用将URDF模型加载到Gazebo;4)Gazebo插件系统,详细说明了Model和Sensor插件的配置方法,并以RRBo

文章图片
#人工智能#机器人
RAG评估:G-Eval与其他LLM评估框架

《G-Eval:让大模型当裁判的RAG评估新范式》摘要 G-Eval是一种创新的RAG系统评估框架,它突破传统人工评估成本高、自动化指标不准确等局限,开创性地利用大语言模型作为评估裁判。该框架通过两大核心步骤:首先生成详细的评估"思维链"分解评价维度,然后采用"填表式"打分结合概率加权计算最终得分。实验证明,G-Eval在摘要和对话生成等任务上的评估结果与人

文章图片
#人工智能
Adaptive Retrieval:自适应检索的RAG动态优化机制

传统检索增强生成(RAG)系统采用固定检索策略存在资源浪费和信息不足的问题。自适应检索(Adaptive Retrieval)通过动态调整检索策略解决这一矛盾,其核心在于三层逻辑:是否检索、检索多少和检索什么。实现机制包括基于不确定性的触发检索、问题复杂度评估、强化学习优化以及层级化决策。典型系统通过模块化设计实现"按需取证"的智能检索,有效提升生成质量和效率。

文章图片
#人工智能
LeRobot 实战系列(三):SO101 机械臂摄像头遥操作与数据采集指南(上)

引导用户或自动控制机械臂移动到预设的校准基准点(如机械臂的零位、特定关节角度组合对应的物理位置);采集每个基准点的硬件原始位置数据(如电机编码器读数、传感器反馈);

文章图片
#人工智能
具身智能从DRL-robot-navigation学起

在这个数字化和智能化日益加速的时代,机器人技术正在逐渐改变我们的生活方式。是一个非常不错的入门开源项目,它利用深度强化学习(Deep Reinforcement Learning, DRL)让机器人实现自主导航,通过模拟环境训练机器人,使其能够学习如何在复杂环境中有效地移动,避开障碍物并达到目标位置。其核心技术是基于TensorFlow实现的深度Q网络(Deep Q-Network, DQN),这

文章图片
#人工智能
基于 Cyclone DDS 的 ROS2 通信优化与实现

随着机器人系统的日益复杂,机器人通信的实时性、稳定性和可扩展性变得尤为重要。在 ROS2(Robot Operating System 2)中,底层通信采用了 DDS(Data Distribution Service)作为核心中间件。不同的 DDS 实现具有各自的优势和应用场景,其中。来分析数据通信的效率。最后,我们将进行实验测试,并分析 Cyclone DDS 在机器人系统中的表现。其中 Dm

文章图片
探索提示工程 Prompt Engineering的奥妙

AGI是一种能够理解、学习和执行任何人类可以完成的任务的智能。提示工程主要应用于专用人工智能,通过设计和优化提示词,提高人工智能系统的性能和准确性。有效的提示词能够引导AI生成高质量、相关性强的输出。提示词的设计和优化是提示工程的核心。提示工程(Prompt Engineering)是设计和优化提示词以获取理想输出的过程。它涉及理解AI模型的行为和限制,构建精确、明确和上下文相关的提示词。提示工程

文章图片
显卡架构深度解析与AI时代选型指南:从深度学习到具身智能的全方位剖析

GPU已成为AI计算的核心硬件,其选型直接影响AI应用的性能。本文系统分析了NVIDIA GPU架构的演进历程,从Pascal到Blackwell架构的技术创新,重点介绍了Tensor Core、NVLink等关键技术在不同AI场景中的应用。详细对比了RTX 40系列和数据中心级GPU的规格参数,并针对具身智能等特殊场景的需求特点,提出了专业的GPU选型建议。文章为AI开发者提供了从底层架构到实际

文章图片
#人工智能#架构#深度学习
    共 85 条
  • 1
  • 2
  • 3
  • 9
  • 请选择