logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

记一次 Ollama 部署 GGUF 模型后的异常输出修复

模型被当成了补全模型使用,而不是聊天模型使用。对于一些从 Hugging Face 直接拉取的 GGUF 模型,尤其是非官方、混合训练、偏代码或 Agent 数据的模型,不能默认假设 Ollama 一定能正确识别它的聊天模板。helloTEMPLATESYSTEM如果模板缺失或不合适,就应该自己写一个 Modelfile,明确指定对话格式和停止词。这类问题并不罕见,尤其是在使用 GGUF、Olla

#java#人工智能#python
WSL 下使用 Claude Code Router 将 VS Code Claude Code 指向 AWS Bedrock GLM-5 模型

本文介绍了在Windows+WSL环境下配置VS Code使用Claude Code插件连接AWS Bedrock的GLM-5模型的方法。主要内容包括: 搭建架构:通过Claude Code Router将Claude Code插件请求路由到AWS Bedrock的zai.glm-5模型 配置步骤: 安装Claude Code Router 设置路由配置文件 配置VS Code插件环境变量 验证连

#aws#云计算
Claude Code + CCR + AWS Bedrock 踩坑复盘:上下文超限、模型路由、Mantle 端点与 Qwen3 Coder Next

这次排查中,我先后尝试了 GLM-5、MiniMax,最后发现 Qwen3 Coder Next 的上下文达到256,能够解决本次的问题。AWS Bedrock 官方模型卡显示,Qwen3 Coder Next 是面向代码生成、调试和软件工程能力优化的模型。同时它支持ResponsesInvoke和Converse等接口类型,并支持与端点。AWS 文档还特别提示,尽可能使用endpoint。AWS

#aws#云计算
构建“问题单审核经验官”:用 Hermes + AWS Bedrock + 钉钉 Stream 做企业审核经验沉淀智能体

Hermes 可以做:- 查询历史问题单分析数据- 总结退回原因- 分析人工推翻记录- 生成经验报告- 生成审核规则建议- 生成 Skill 草案- 通过钉钉向负责人汇报Hermes 不可以做:- 关闭问题单- 修改问题单优先级- 修改问题单责任人- 修改生产审核规则- 直接发布 Dify / Coze Workflow- 直接调用生产数据库写接口这是整个方案的安全底线。“问题单审核经验官”的核心

#aws#云计算
构建“问题单审核经验官”:用 Hermes + AWS Bedrock + 钉钉 Stream 做企业审核经验沉淀智能体

Hermes 可以做:- 查询历史问题单分析数据- 总结退回原因- 分析人工推翻记录- 生成经验报告- 生成审核规则建议- 生成 Skill 草案- 通过钉钉向负责人汇报Hermes 不可以做:- 关闭问题单- 修改问题单优先级- 修改问题单责任人- 修改生产审核规则- 直接发布 Dify / Coze Workflow- 直接调用生产数据库写接口这是整个方案的安全底线。“问题单审核经验官”的核心

#aws#云计算
Claude Code + CCR + AWS Bedrock 踩坑复盘:上下文超限、模型路由、Mantle 端点与 Qwen3 Coder Next

这次排查中,我先后尝试了 GLM-5、MiniMax,最后发现 Qwen3 Coder Next 的上下文达到256,能够解决本次的问题。AWS Bedrock 官方模型卡显示,Qwen3 Coder Next 是面向代码生成、调试和软件工程能力优化的模型。同时它支持ResponsesInvoke和Converse等接口类型,并支持与端点。AWS 文档还特别提示,尽可能使用endpoint。AWS

#aws#云计算
WSL 下使用 Claude Code Router 将 VS Code Claude Code 指向 AWS Bedrock GLM-5 模型

本文介绍了在Windows+WSL环境下配置VS Code使用Claude Code插件连接AWS Bedrock的GLM-5模型的方法。主要内容包括: 搭建架构:通过Claude Code Router将Claude Code插件请求路由到AWS Bedrock的zai.glm-5模型 配置步骤: 安装Claude Code Router 设置路由配置文件 配置VS Code插件环境变量 验证连

#aws#云计算
openclaw 从零开始基于源码安装

不要直接sudo apt-get install node,那安装的是18的版本,达不到要求。注意,本地模型选择时不要选deepseek-r1:1.5b,那个还不支持工具调用。实际执行起来就是OpenClaw setup,进行配置。这一步遇到过两个问题,分别是GIT的问题和NPM没有安装的问题。因为在安装过程中会通过GIT CLONE一个SSH的仓库。从源码开始安装,以便有问题可以深入源码了解。如

从MAC电脑复制qwen3.5:4b 的OLLAMA模型到LINUX电脑实践

文件都放对了,如果权限不对,Ollama 仍然可能无法正常读取。所以非常重要。这次实践证明,Ollama 的本地模型是可以在不同机器之间手工迁移的。找到 manifest找到对应 blobs保持目录结构复制到目标机器修正权限验证运行对于局域网机器迁移、离线环境部署、或者避免重复下载大模型,这种方法都非常实用。qwen3.5:4b并且能够直接运行,这说明整个复制流程是有效的。

#macos#linux#运维
openclaw 使用亚马逊amazon-bedrock模型的配置方法

OPENCLAW默认不支持选择AWS上的amazon-bedrock模型,因此,要想用AWS上的模型,只能自行修改它的配置了。

    共 19 条
  • 1
  • 2
  • 请选择