logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

gRPC说明及使用(java版)

一元 RPC,其中客户端向服务器发送单个请求并得到单个响应,就像普通函数调用一样。服务器流式 RPC 中,客户端向服务器发送请求并获取流以读取一系列消息。客户端从返回的流中读取,直到没有更多消息。gRPC 保证单个RPC 调用中的消息排序。客户端流式RPC,客户端使用提供的流编写一系列消息并将其发送到服务器。客户端完成编写消息后,它会等待服务器读取消息并返回响应。同样,gRPC保证了单个 RPC

文章图片
#rpc
Huggingface下载模型的几种方式

【代码】Huggingface下载模型的几种方式。

文章图片
#python
主流向量数据库对比

粗体推荐使用,性能较好。

文章图片
#数据库
Ollama安装部署及加载自定义量化Qwen大模型

Qwen/Qwen1.5-1.8B-Chat模型为例子ModelFile文件内容。

文章图片
#人工智能#语言模型
skywalking-agent自定义插件

SkyWalking 插件的工作机制主要基于 Java Agent,它会在应用启动时自动附加到目标应用上。插件主要实现方法拦截(Method Intercept),即在指定的方法执行之前、之后或者发生异常时进行操作,以便收集监控数据。增强类定义(Enhancement Class):指定需要增强的目标类。方法拦截器(Method Interceptor):定义拦截的逻辑,比如调用链的开始、结束、异

文章图片
#skywalking
Ollama安装部署及加载自定义量化Qwen大模型

Qwen/Qwen1.5-1.8B-Chat模型为例子ModelFile文件内容。

文章图片
#人工智能#语言模型
GGUF介绍安装及使用

GGUF 格式的全名为(GPT-Generated Unified Format),提到 GGUF 就不得不提到它的前身GGML 是专门为了机器学习设计的张量库,最早可 以追溯到 2022/10。其目的是为了有一个单文件共享的格式,并 且易于在不同架构的 GPU 和 CPU 上进行推理。但在后续的开发 中,遇到了灵活性不足、相容性及难以维护的问题。

文章图片
#python#语言模型
Ollama安装部署及加载自定义量化Qwen大模型

Qwen/Qwen1.5-1.8B-Chat模型为例子ModelFile文件内容。

文章图片
#人工智能#语言模型
Ubuntu系统:Miniconda3下载安装

如果显示版本号,说明安装成功。

文章图片
#ubuntu#linux#运维
    共 12 条
  • 1
  • 2
  • 请选择