小石子是个人主页

@u013220851

小石子是

2023-01-13 10:12:56 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

文字转语音 EDGE_TTS

这是一款微软语音转文字的项目，不要电脑配置因为他是通过类爬虫方式把文字转语音，跟官方比起来速度会慢一点但是基本够用。默认是通过命令行的方式不适合集成到我们自己的项目通过封装成接口的方式使用。

#edge #语音识别 #前端

Ollama 上下文限2048的解决方案

ollama默认限制上下文的长度是2048，如果我们用ollama作为知识库基准模型，上下文超过2048直接会被阻断，提出内容不会根据上下文来回答官方提出一个解决方案那就是通过设置num_ctx的大小来设置上下文，但是如果把会话改成ollama支持的openAI的方式这个属性就无效了经过本人的测试默认qwen2.5:14b-instruct-q8_0占用17g的显存也就是限制上下文2048，但是如

#chrome #前端

简单编码方式构建大模型知识库

知识库构建需要一个大模型这里选用ollama可以选用qwen2模型，其次我们需要知识的检索跟知识的排序，部署xinference平台。图中的流程几乎都在调用http，只是做简单的逻辑梳理就能通过编码的方式来构建了知识库，在此基础上我们可以更加深入的进行业务调整。本文只用到http相互调用来构建知识库。只需要简单的python基础。embedding就是向量，转成向量后的数据可以保存到数据库中，通过

#python #开发语言

springboot 使用 ollama 搭建的大模型

，如果是 Windows 系统（如：D:\OllamaModels），避免 C 盘空间吃紧：Ollama 服务监听的网络地址，默认为，如果允许其他电脑访问 Ollama（如：局域网中的其他电脑），成，从而允许其他网络访问：Ollama 服务监听的默认端口，默认为等）：HTTP 客户端请求来源，半角逗号分隔列表，若本地使用无严格要求，可以设置成星号，代表不受限制：大模型加载到内存中后的存活时间，默认

#java

Ollama 上下文限2048的解决方案

#chrome #前端

到底了