
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
之前写过x86版本的快速docker安装部署,现在遇到arm64等架构cpu不适用,主要是因为安装包不通用,因此有这篇文章。cpu测试可以支持鲲鹏cpu或interl arm版本离线安装docker,10分钟极速搞定!亲测适用于CentOS8 及其衍生版本。

使用GPU需要安装 NVIDIA Container Toolkit: https://hub.docker.com/r/ollama/ollama。如果想使用Qwen2.5-7B模型,可以在这个模型页选择适合自己算力需求的模型下载。ollama create#从模型文件创建模型。ollama pull#从注册表中拉取模型。ollama serve#启动ollama。ollama run#运行模
在构建智能对话应用时,准确识别用户意图是核心挑战。为了解决输出不可控、准确率低、响应速度慢等问题,本文介绍了一个基于FastGPT的全局意图识别插件。该插件通过简单的JSON配置,支持定义5-10种场景意图,如查酒店、问天气等,适用于多种行业。插件的核心优势在于其高度通用性、配置简便性和快速集成能力。通过预设场景意图和JavaScript代码,插件将用户意图识别转化为选择过程,用户只需回复序号即可

本文对比了流式与非流式语音识别模型的配置差异。非流式组合(含VAD和标点)适合离线音频转写,而流式组合(基础ASR+实时标点)专为低延迟场景设计。关键区别在于:非流式ASR集成VAD/标点模块,处理完整音频;流式标点针对中文实时优化但精度可能降低。部署时需注意流式处理需分块逻辑,且标点模型需与ASR语言匹配。离线场景推荐非流式方案,实时场景应选择流式组合。
无障碍增强工具类,助力高效开发函数都是实战检验并高效稳定运行,如寻找上一个/下一个兄弟节点,打印视图树等便捷操作findOneByTextfindOnceByText按文本(关键词)寻找节点和子节点内的所有匹配项findAllByTextfindOneByClazzfindOnceByClazz按类名寻找节点和子节点内的所有匹配项findAllByClazzfindAllOnceByClazz..
本文基于Claude Code设计理念,提出一个高内聚、低耦合的MCP-Filesystem Server架构方案。该方案包含6个核心工具:fs_read(安全只读)、fs_write(覆盖写入)、fs_edit(精确修改)、fs_search(合并搜索)、exec(Python执行)和preview_frontend(前端部署)。每个工具职责单一、权限边界清晰,支持多种文件格式自动识别,实现文件
本文深入解析Anthropic官方AI编程助手Claude Code的工具架构设计。重点剖析了15个核心工具的分层体系,包括文件操作类(Read/Write/Edit等)、执行类(Bash/NotebookEdit等)、交互类(AskUserQuestion等)和信息获取类(WebFetch等)。文章揭示了Claude Code"每个工具都是一个权限边界"的核心设计理念,对比了
本文通过四个案例展示了OpenManus如何利用**工具抽象(Tool Abstraction)**机制,将底层复杂实现封装为LLM可理解的简单函数调用。案例1演示了LLM通过computer_use工具控制远程沙箱GUI,无需了解底层架构;案例2通过crawl4ai工具将网页内容智能清洗为Markdown,避免处理HTML噪音;案例3展示了多智能体协作任务分解与执行;案例4则通过python_e
本文深入分析了OpenManus项目在AI智能体领域的三大核心设计:1)采用滑动窗口截断和动态Prompt注入的上下文管理策略,有效防止Token溢出;2)基于"共享计划"的多智能体协作机制,通过全局状态维护实现高效解耦;3)构建了包含Python执行沙箱、浏览器操作等核心工具集的MCP生态,并深度集成Daytona虚拟环境实现安全执行。该项目虽完成度有限,但其在动态上下文构建
该服务使用阿里达摩院的模型,并支持SSL连接、2pass模式以及语音热词处理。你还需要从阿里云上下载相关的语音识别模型、VAD模型、标点符号模型等。这些模型是由达摩院发布的,具体的模型目录稍后会在启动命令中给出。这样,你的VAD模型将在600毫秒后检测到结束静音,适用于需要更快速响应的语音识别场景。的VAD参数,你可以根据具体需求定制VAD的检测灵敏度和时长。这些参数控制了VAD的静音检测、语音与








