logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从大模型到轻量级部署:知识蒸馏优化技术

知识蒸馏(Knowledge Distillation, KD)是一种模型压缩与优化技术,旨在将复杂高性能模型(教师模型,Teacher Model)的 “知识” 迁移到轻量模型(学生模型,Student Model)中,使学生模型在参数量和计算成本大幅降低的同时,尽可能保留教师模型的性能。

#深度学习
Elasticsearch全文检索中文分词:IK分词器详解与Docker环境集成

IK分词器(IK Analyzer)是Elasticsearch中广泛使用的中文分词插件,专门针对中文文本进行高效的分词处理。

#全文检索#elasticsearch#中文分词
基于vLLM高效部署:Qwen2.5与DeepSeek-R1-Distill-Qwen实战指南

基于vLLM高效部署:Qwen2.5与DeepSeek-R1-Distill-Qwen实战指南

文章图片
#人工智能#自然语言处理
深度解读 Chinese CLIP 论文:开启中文视觉对比语言预训练

本文提出了 Chinese CLIP,这是一个专为中文设计的视觉 - 语言基础模型。构建了一个包含约 2 亿个样本的预训练数据集,并使用所提出的两阶段预训练方法对一系列 Chinese CLIP 模型进行预训练,提高了预训练的效率和效果。Chinese CLIP 在多个跨模态检索数据集上,无论是零样本学习还是微调设置下,都能达到最先进的性能,在 10 个数据集的零样本图像分类任务中,也能取得颇具竞

文章图片
知识库搜索新范式:FastGPT知识库搜索方案全解析

FastGPT 知识库结构设计,理解其 QA 的存储格式和多向量映射,以便更好的构建知识库

文章图片
#RAG
ReAct 与 Function Call:两种主流 Agent 技术解析与实践

在人工智能领域,Agent 技术正成为推动 AI 系统向主动推理、复杂任务处理演进的核心方向。本文将深入解析当前主流的两种 Agent 技术 ——ReAct(推理与行动协同框架)和Function Call(结构化功能调用),探讨其技术原理、应用场景及开发实践要点。

文章图片
面向多模态检索的向量数据库对比分析和技术选型:Elasticsearch、Milvus、Pinecone、FAISS、Chroma、PGVector、Weaviate、Qdrant

面向多模态检索的向量数据库对比分析和技术选型:Elasticsearch、Milvus、Pinecone、FAISS、Chroma、PGVector、Weaviate、Qdrant

文章图片
#数据库
Milvus vs. ElasticSearch:向量库检索性能测试

Milvus vs ElasticSearch 向量检索性能测试

文章图片
#milvus#elasticsearch
FastGPT极速上手指南:Docker容器化部署实战

使用 Docker Compose 快速部署 FastGPT 4.9.7版本

文章图片
#docker#RAG
    共 106 条
  • 1
  • 2
  • 3
  • 11
  • 请选择