logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

docker ollama部署轻量级嵌入模型 - EmbeddingGemma

EmbeddingGemma是google发布的轻量级文本嵌入和生成模型,包括embeddinggemma文本嵌入模型和 gemma3n:e2b文本生成模型。EmbeddingGemma适合低延迟、高吞吐量场景,例如智能手机、物联网设备的实时文本处理。

#数据分析#人工智能
基于langchain链的SQL DB知识库系统

目前广泛使用的关系数据库有mysql、oracle、postgresql、sqlite。构建基于SQL DB的知识库问答系统,需要模型生成SQL查询,具体为1)模型将用户输入转换为SQL查询。2)执行SQL查询,执行查询。3)模型使用查询结果响应用户输入。过程如下图所示,这里参考网络资料,基于sqlite和langchain,尝试示例基于LLM的关系数据库问答系统。

#数据库#大数据#人工智能
langchain agent将用户问题转sql并运行sql查询

之前探索了基于chain将用户问题转化为sql查询并运行。这里尝试基于agent,采用更智能的方式决定是否将用户问题转化为sql、并进行sql查询。

#sql#数据库
基于deepseek的文本解析 - 超长文本的md结构化

然而,不管是langchain还是llamaindex提供的文本分割工具,很难直接对非结构化文本进行准确的语义分割,很多原来连续的内容都被分割在不同块中。deepseek完成本次解析后,将deepseek解析生成的结构化md作为already_parsed输入,将下次待解析非结构化的若干页文档作为waiting_parsed输入。这里尝试基于deepseek,将pdf解析后的非结构化文本转化为结构

#人工智能#nlp
在mac m1基于ollama运行deepseek r1

deepseek-r1:8b 比较适合笔记本部署,大约5G左右,当然也可以根据电脑配置选择其他版本。ollama将deepseek-r1:8b拉到本地后,就可以开始交互测试了。相比llama.cpp,ollama因为集成各种工具,使用更简单。在mac m1基于llama.cpp运行deepseek。在ollama的官网下载mac m1版本的ollama。2运行deepseek r1。最终获得如下所

#macos
如何基于OneAPI构建langchain RAG系统

langchain是LLM时代广泛使用的agent和rag构建工具。这里尝试构建基于langchain的RAG系统。

#人工智能#数据分析
在mac m1基于llama.cpp运行deepseek

/bin/llama-cli -m ../../DeepSeek-R1-Distill-Qwen-7B/model-q4_0.gguf -p "你好?转化后GGUF模型文件../DeepSeek-R1-Distill-Qwen-7B/DeepSeek-R1-Distill-Qwen-7B-F16.gguf。量化后的gguf int4文件../../DeepSeek-R1-Distill-Qwen-

#人工智能#语言模型#macos
python调用远程服务器的ollama embedding模型

实际应用中,ollama embedding模型有可能部署在远程服务器。这里探索通过ollama包和langchain包访问部署在远程服务器的embedding嵌入式模型。

#服务器
linux系统ollama监听0.0.0.0:11434示例

docker应用如dify访问本地主机部署的ollama,base_url不管配"http://localhost:11434",还是"http://host_ip:11434"都会报错。2)docker容器访问http://host_ip:11434,虽然是主机服务,但ollama默认不绑定0.0.0.0:11434,docker容器同样找不到部署在主机的ollama。linux系统ollama

#linux#服务器#人工智能
基于ollama运行27b gemma3解决ffmpeg命令生成问题

google开源的LLM模型gemma3,提供了1B、4B、12B、27B多个版本,特别是27B版本,被认为除Deepseek R1外性能最好的开源模型。这里尝试运行ollama 27B,并解决ffmpeg命令生成问题。

#人工智能
    共 290 条
  • 1
  • 2
  • 3
  • 29
  • 请选择