携梦问道个人主页

@qq_41797451

携梦问道

2023-09-09 21:53:02 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大模型显存计算指南 - 推理与训练显存计算详解

推理阶段主要考虑参数量、注意力缓存和激活值训练阶段需额外考虑梯度、优化器状态和前向计算缓存合理使用显存优化技术可以突破硬件限制希望这篇文章能帮助你更好地理解和规划大模型的显存使用！

Qwen-TTS重磅发布：阿里通义语音合成技术新突破，方言与双语合成真实感媲美真人

阿里云通义实验室推出新一代语音合成模型Qwen-TTS，基于300万小时语料训练，支持北京话、上海话、四川话等方言及中英双语，实现接近真人的自然度和情感表达。该模型采用自回归生成技术，可智能调整语速语调，适用于虚拟主播、智能客服、教育等领域。文章详细解析了Qwen-TTS的技术原理、应用场景，并提供了API调用代码示例，展示了其在不同语言和方言上的出色表现。测试数据显示，该模型在语音自然度和语义理

一招搞定自动化！手把手教你用Docker部署n8n工作流神器

本文详解如何通过两条Docker命令快速搭建n8n自动化工作流平台，揭秘数据持久化的关键配置，助你轻松实现跨平台自动化操作，文末附赠实践小贴士。

#自动化 #docker #运维

构建专属AI知识库：Obsidian Copilot + 硅基流动SiliconCloud API 实战指南

在信息爆炸的时代，如何有效地管理和利用个人或团队的知识资产成为了一个关键问题。对于那些寻求提高效率和创新能力的人来说，拥有一个智能化的知识管理系统显得尤为重要。本文将向您介绍如何结合Obsidian Copilot这一强大的开源AI助手插件与硅基流动SiliconCloud提供的丰富多样的模型API服务，创建一个既注重隐私又能提供强大功能的本地AI知识库。Obsidian Copilot是一款专为

#人工智能 #copilot

【2024保姆级教程】LangChain智能体开发从入门到实战：零基础手把手打造AI对话机器人｜附企业级电商客服项目源码

LangChain是一个专为构建大模型应用设计的开发框架，其模块化设计和丰富的工具链让智能体开发更高效。内置Agent模板：快速实现工具调用、多轮对话、记忆管理无缝对接主流大模型：支持OpenAI、ChatGLM、DeepSeek等灵活可扩展：通过Chains组合实现复杂业务逻辑。

#人工智能 #机器人

利用Python将多个excel文件合并为一个文件

# -*- coding: utf-8 -*-#导入需要使用的包import xlrd #读取Excel文件的包import xlsxwriter #将文件写入Excel的包#打开一个excel文件def open_xls(file): f = xlrd.open_workbook(file) return f#获取excel中所有的sheet表def getsheet(f):

【2024保姆级教程】LangChain智能体开发从入门到实战：零基础手把手打造AI对话机器人｜附企业级电商客服项目源码

#人工智能 #机器人

git checkout dev 和 git switch dev 有什么区别？别再混淆了！

在 Git 的日常使用中，切换分支是一个高频操作。和看起来它们都能完成“切换到 dev 分支”的任务，但它们到底有什么本质区别？什么时候该用哪个？今天我们就来彻底搞清楚！需求推荐命令安全地切换已有分支✅创建并切换新分支✅想要查看某个 commit 的历史版本⚠️ 使用想要恢复某个文件的内容⚠️ 使用自动创建并跟踪远程分支✅虽然依然强大且兼容性强，但随着 Git 的发展，官方越来越推荐我们使用更加语

#git

Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略

本文详细介绍了如何从零开始部署和使用Qwen3-8B大语言模型。主要内容包括：1) 使用vLLM框架进行多GPU高效部署的完整脚本和参数说明；2) 通过OpenAI兼容接口与模型交互的Python示例；3) 函数调用的实战应用，展示如何定义工具和调用外部API；4) 结合LangChain构建高级应用的方法。文章强调了Qwen3-8B在推理、工具使用方面的优势，并提供了完整的代码示例。最后展望了Q

如何让 Ollama 模型始终驻留显存？高效调用 AI 推理服务的秘诀！

本文介绍如何通过Ollama的keep_alive参数优化本地大语言模型部署效率。默认模型5分钟自动卸载导致重复加载损耗性能，可通过API参数（如"24h"或"infinite"）或环境变量OLLAMA_KEEP_ALIVE实现模型常驻显存。详细说明Linux系统下systemd服务的配置方法，并提醒注意显存容量与多模型场景的资源管理。该方案可显著减少加载延

#人工智能

共 53 条

请选择