logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM基础-什么是大模型推理(LLM Inferencing)

和传统的机器学习模型类似,大模型也可以分为:模型训练和模型推理两个过程。模型训练就是给定的数据和算法训练出一个模型(一堆文件,包括:模型权重、配置等),然后就可以使用该模型来进行预测或分类等操作。模型推理(Model inference)是使用已训练的机器学习模型根据新的输入数据生成预测的过程。

文章图片
#人工智能#语言模型
dify实现原理分析-上传文件创建知识库总体流程

本文介绍了dify在上传文件构建知识库的总体流程。dify提供三种方式来创建构建知识库,本文主要介绍了文件上传的总体流程,索引的构建实现流程在后面的文章中进行分析。

文章图片
#人工智能
dify实现分析-rag-文档内容提取

在文章《[dify实现原理分析-上传文件创建知识库总体流程](https://blog.csdn.net/zg_hover/article/details/144954733?spm=1001.2014.3001.5501)》中已经介绍了,文件上传后索引构建的总体流程,本文介绍其中的“Extract: 提取文档内容:这里会按段落或整页来获取文档内容”步骤的实现。

文章图片
#人工智能
数字身份危机:AI智能体与氛围编码如何重塑传统安全

数字世界正面临一场由AI智能体、机器身份激增和"氛围编码"引发的身份危机。传统基于人类用户的身份验证机制被颠覆,静态凭证难以应对动态AI行为,开发速度与安全的矛盾加剧。新范式需从静态身份转向动态行为信任,结合短期凭证、行为分析和情境感知构建信任网络。未来的安全必须融合密码学、上下文和行为信号,在AI主导的时代重构身份管理规则。

#人工智能#安全#语言模型
编码Agent上下文管理:让AI驾驭复杂代码库

本文探讨了AI编程工具在复杂代码库中的效率困境,提出了"高级上下文工程"解决方案,特别是"频繁有意压缩"(FIC)技术。该技术通过结构化提炼开发过程中的信息,优化上下文窗口的四个维度:正确性、完整性、大小和轨迹。同时引入子Agent机制来管理噪音信息,保持主Agent上下文聚焦。实践表明,在30万行Rust代码库中,采用该技术仅用7小时就完成了预估3-5天的

#人工智能
编码Agent上下文管理:让AI驾驭复杂代码库

本文探讨了AI编程工具在复杂代码库中的效率困境,提出了"高级上下文工程"解决方案,特别是"频繁有意压缩"(FIC)技术。该技术通过结构化提炼开发过程中的信息,优化上下文窗口的四个维度:正确性、完整性、大小和轨迹。同时引入子Agent机制来管理噪音信息,保持主Agent上下文聚焦。实践表明,在30万行Rust代码库中,采用该技术仅用7小时就完成了预估3-5天的

#人工智能
数据库询问RAG框架Vanna的总体架构

总的来说Vanna是根据RAG构建了自己的后台架构。通过和向量库的知识库检索相关上下文知识,可以让生成的SQL语句更加准确。Vanna提供了正确知识的反馈机制,这可以说是一种自我学习的过程,这样可以让后续的回答更加准确。另外,在整个过程中加入了人工审核的过程,这在大模型的精准度没有达到一定程度之前,是非常有必要的。Vanna还提供多种使用方式(有前端,或没有前端),这样可以让用户使用起来更加灵活。

文章图片
#人工智能#语言模型
llamaindex实战-使用deepseek大模型进行本地中文问答

本文使用deepseek大模型来进行本地中文问答。另外,嵌入模型使用中文嵌入模型:dmeta-embedding-zh。由于我只有16C64G的CPU配置,所以只能使用:deepseek-llm:7b。因为,deepseek_v2这个模型在该配置下跑不起来。

#人工智能
dify实现原理分析-上传文件创建知识库总体流程

本文介绍了dify在上传文件构建知识库的总体流程。dify提供三种方式来创建构建知识库,本文主要介绍了文件上传的总体流程,索引的构建实现流程在后面的文章中进行分析。

文章图片
#人工智能
AI程序员(aider)+ollama+DeepSeek-R1安装配置和使用

aider其实是ai coder的缩写,可以说是一个ai programmer,可以根据需求编写代码,可以分析代码,重构代码等。比一般的代码助手更加智能。目前还处于比较初级的版本,但已经具备一定的可用性。本文介绍aider的本地部署和使用,通过ollama的部署和使用可以让aider使用本地部署的大模型。比如:qwen或deepseek等。ollama的安装和模型的拉取,可以参考我前面的文章,这里

文章图片
#人工智能
    共 52 条
  • 1
  • 2
  • 3
  • 6
  • 请选择