logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI人工智能之重排序原理与代码详解

本文介绍了基于Transformer架构的企业级需求管理系统中的重排序技术实现。系统采用Qwen3-Reranker-0.6B-ONNX模型,通过批处理、线程池优化和缓存机制提升性能,支持最大512序列长度和8批量大小。核心功能包括查询-文档语义匹配、动态负载均衡、异常恢复机制等,实现了无GPU环境下高效运行,为信息检索提供精准的重排序能力。

文章图片
#人工智能
大模型中的分词器的原理与使用方式

特性说明目的将原始文本转换为模型可处理的数字ID序列。主流方法子词分词(Subword Tokenization),尤其是BPE及其变种(如Byte-level BPE)。核心组件词汇表(Vocabulary):一个映射字典,key是token,value是对应的ID。特殊符号[CLS](分类)、[SEP](分隔)、[PAD](填充)、[MASK](掩码)、[UNK](未知)。使用流程加载分词器

文章图片
#人工智能
需求管理产品之--大模型中的张量及框架张量类型

文章摘要:本文系统介绍了深度学习中的张量概念及其在PyTorch和TensorFlow框架中的实现差异。首先阐述了张量作为多维数组的核心特性(形状、数据类型、设备等),并通过实例说明其在大模型中的应用场景。其次详细对比了两大框架的张量操作特性:PyTorch强调动态图和灵活调试,TensorFlow侧重生产部署和静态图优化。最后提出了大模型开发中的最佳实践建议,包括形状管理、混合精度训练和设备协调

文章图片
#人工智能#需求分析
到底了