XianxinMao 个人主页

@XianxinMao

XianxinMao

2022-06-23 15:12:15 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

知识图谱减少大语言模型幻觉

知识图谱（KGs）通过提供结构化知识和逻辑规则，有效减少了大语言模型（LLMs）中的“幻觉”现象，即生成内容与事实不符的问题。知识图谱不仅为LLMs提供事实依据，还通过逻辑规则约束其输出，确保生成内容的准确性和连贯性。此外，知识增强推理技术通过将复杂查询分解为多个步骤，并利用知识图谱的推理路径，帮助LLMs进行多步推理，进一步提升其在复杂任务中的表现。图算法如G-Retriever和GraphRA

#知识图谱 #语言模型 #人工智能

Gradio: 快速原型设计工具，无需前端知识即可创建直观的机器学习模型Web界面

Gradio是一个开源Python库，用于无需JavaScript、CSS或Web托管经验，通过简单的Python代码快速构建机器学习模型、API或任何Python功能的动态演示或Web应用。它通过提供直观的框架简化了开发流程，使得机器学习开发者、研究人员和爱好者可以创建美观互动的演示，增强模型的理解和可接近性，让技术更接近广泛用户。

#机器学习 #人工智能

智能SQL聊天机器人：简化数据库查询

通过结合AutoGen、LangChain和SQLite，构建的SQL聊天机器人极大地简化了数据库查询操作。AutoGen负责管理对话流程，LangChain将自然语言转换为SQL语句，而SQLite作为轻量级数据库，提供了高效的数据访问。Function Calling Schema的引入进一步增强了机器人的功能性和交互性，使其能够智能地执行函数调用，提升用户体验。这种技术组合不仅降低了数据库使

#数据库 #sql #机器人 +1

视频目标检测：HOTA指标全面革新

当前视频目标检测领域缺乏统一的评估指标，尤其是能够全面捕捉时间维度性能的指标。现有指标如mAP主要针对静态图像，无法反映视频中目标的连续性和一致性。HOTA（Higher Order Tracking Accuracy）及其变体CA-HOTA（Classification-Aware HOTA）通过平衡检测、关联、定位和分类性能，提供了一个综合的评估框架。HOTA能够跨越多帧进行关联评估，而CA-

#音视频 #目标检测 #目标跟踪 +1

《神经表征与人工智能：从生物到人工神经网络的表征机制研究》

大脑通过内部表征处理外部信息的能力是人类认知的核心。这一过程依赖于神经元的活动模式，通过感知、编码、整合和存储等步骤，使我们能够理解和适应复杂的环境。这一机制不仅对科学研究至关重要，也为人工智能和教育等领域提供了宝贵的启示。

#人工智能

BinaryMoS: 提升二值化大语言模型的创新技术

BinaryMoS作为一种新的二值化技术，通过引入混合缩放的理念，有效提升了大语言模型的性能和记忆效率。无论是在Llama 3的应用，还是结合HQQ量化的方法，BinaryMoS都展现了其在自然语言处理领域的重要潜力。随着AI技术的不断进步，期待BinaryMoS能够推动更多创新应用的诞生。

#语言模型 #人工智能 #自然语言处理

BitNet a4.8：通过4位激活实现1位大语言模型的高效内存推理

随着大语言模型（LLMs）的广泛应用，如何在限制内存和提高计算效率之间取得平衡，成为学术界和工业界的重要课题。最近的研究表明，1位（1-bit）LLMs在性能上可以与全精度模型相媲美，同时在内存、能源和处理时间的消耗上具备显著优势。本文将介绍新兴的BitNet a4.8模型，它结合了稀疏性与量化技术，利用4位激活优化1位LLMs的推理效率。

#语言模型 #人工智能 #自然语言处理

模型部署的开源机器学习工具 MLflow | 每日工具推荐

今天要介绍的工具是 MLflow，该工具可分为 4 个模块，第一个是 MLflow Tracking，用于记录和查询实验结果，包含代码、数据、配置等，第二个是 MLflow Projects，用于打包代码以实现在任意平台上的重复运行，第三个是 MLflow Models，用于在各种各样的环境下部署机器学习模型，第四个是 Model Registry，用于存储、标记、探索、管理模型。本篇文章不可能介

#python #git

深度学习置信度校准的关键作用

置信度校准在深度学习中至关重要，尤其是在高风险应用如自动驾驶和医疗诊断中，能够避免模型因过度自信而导致的重大错误。现代神经网络常存在“过度自信”问题，即模型即使预测错误，仍以高概率输出结果。通过温度缩放、集成方法、Mixup等技术，可以有效提高模型的校准能力，尤其是在处理分布外（OOD）数据时。这些方法各有优劣，选择取决于具体应用场景和资源约束。通过Brier Score、ECE、MCE等校准度量

#深度学习 #人工智能

生成用于目标检测任务的合成图像教程：使用Blender、Python和3D资产

缺少足够的训练数据是当前深度学习面临的一个主要问题。自动生成带有注释的合成图像是计算机视觉任务的一个有前途的解决方案。本文将首先概述合成图像数据的一些图像生成技术，然后生成一个无需手动注释的训练数据集，并使用它来训练一个Faster R-CNN目标检测模型。最后，我们将在真实图像上测试我们训练的模型。

#人工智能 #生成式AI #自然语言处理 +1

共 193 条

请选择