logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM Prompt工程指南

摘要: 本文系统介绍了Prompt工程的核心技术与优化方法。首先分析了Prompt工程的重要性,指出精心设计的提示能显著提升大语言模型的输出质量。随后详细解析了模型参数(温度、Top-K/P)对输出的影响机制,并给出配置建议。接着阐述了基础提示技术(零样本/少样本)的原理与应用场景。最后探讨了引导技术的三大方法:系统提示(定义行为准则)、角色提示(赋予专业身份)和上下文提示(提供任务背景)。文章强

文章图片
#机器学习#人工智能
基于Tranformer的NLP实战(4):BERT实战-文本分类与命名实体识别的数据结构

这篇文章主要探索了用于文本分类和命名实体识别任务的两个数据集结构。文本分类任务中,每条文本会被标注为某一类疾病(癌症、神经系统疾病或其他)NER 任务中,每个词都被标注为 I、O或B,以识别医学文献中的疾病实体。掌握了数据结构,就为后续构建 BERT 模型打下了坚实基础。下一篇文章,我们将正式进入模型构建部分,并了解如何使用 NVIDIA NeMo 工具包。

文章图片
#自然语言处理#bert#分类
深度学习模型部署(1):模型导出

通过本节实验,你已经成功将一个 NLP 模型(BERT)以格式部署到,并进一步探索了通过ONNX和TensorRT格式实现的部署优化。在下一篇文章中,我们将学习如何对模型本身进行优化,并以更高效的方式进行部署…

文章图片
#深度学习#人工智能
机器学习详解(23):Huber Loss损失函数(解决离群值)

Huber回归通过结合平方损失和绝对值损失的优势,有效提升模型在离群值干扰下的鲁棒性。其损失函数以阈值δ控制误差处理方式:小误差时保持平方损失的高精度,大误差时切换为线性损失以降低离群点影响。实验对比显示,相较于传统线性回归,Huber回归在合成数据中更准确拟合真实趋势(如预测值806.72 vs 87.38)。实际应用中需平衡δ的选择,并可通过Scikit-learn快速实现。该方法的灵活性使其

文章图片
#机器学习#人工智能
构建RAG智能体(4):嵌入模型的概念和应用

本文介绍了嵌入模型(Embedding Models)的核心概念及其在NLP中的应用。主要内容包括:1)嵌入模型基础,解释词嵌入和文档嵌入作为文本的数值表示;2)区分解码器模型(用于生成任务)和编码器模型(用于预测任务)的不同架构;3)实战部分展示如何使用NVIDIA嵌入模型处理查询和文档,包括查询嵌入(embed_query)和文档嵌入(embed_documents)的应用场景和区别。文章通过

文章图片
#机器学习#人工智能
CANopen和CAN学习(1):嵌入式网络通用术语

从本篇开始,我将深入学习CANopen和CAN相关知识。但在这之前,本篇文章先来了解一下嵌入式网络相关的通用术语。

文章图片
#网络
CANopen和CAN学习(2):CANopen基础之对象字典、设备配置文件、EDS、SDO、PDO和网络管理

上一节,我们了解了CANopen和CAN学习(1):嵌入式网络通用术语,本节,我们将介绍CANopen协议的主要功能,以及它如何满足嵌入式网络的要求。任何 CANopen 节点的核心是对象字典(,),它是一个由位索引和位子索引组成的查找表。这允许在每个索引下最多有个子条目,每个条目可以包含一个任意类型和长度的变量。对象字典不仅提供了一种将变量与索引和子索引值关联的方法,还指定了数据类型定义表。从索

文章图片
#学习
嵌入式IDE(1):IAR中ICF链接文件详解和实例分析

Keil和IAR都有自己生成链接脚本的格式,本篇文章就来介绍一下与IAR的链接脚本生成相关的.icf)后缀的IAR配置文件。

文章图片
#ide
嵌入式IDE(2):KEIL中SCF分散加载链接文件详解和实例分析

在上一篇文章中,我通过I.MX RT1170的SDK中的内存映射关系,分析了IAR中的ICF链接文件的语法。对于MCU编程所使用的IDE来说,IAR和Keil用得比较多,所以这一篇文章就来分析一下Keil的分散文件.scf。

文章图片
#ide
MD5加密(1):MD5基础知识和计算过程

随着公众对数字隐私教育的共识,人们对加密算法和网络安全的兴趣越来越大。MD5是一种加密哈希函数算法,它将任意长度的消息作为输入,输出一个长度固定为16字节的结果。在正式介绍MD5之前,我们先来了解一下哈希的概念。

文章图片
#哈希算法#算法
    共 61 条
  • 1
  • 2
  • 3
  • 7
  • 请选择