logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

rmmod: ERROR: Module nvidia_uvm is in use

这个错误信息表示nvidia_uvm内核模块当前正在使用中,因此不能被卸载 (rmmodnvidia_uvm是 NVIDIA Unified Memory 驱动程序的一部分,通常在 CUDA 应用程序运行时会被使用。

5.1 LangChain:功能强大的框架,适用于构建复杂的LLM驱动应用

LangChain通过简化提示词管理、记忆机制、工具调用和外部系统集成,支持从简单聊天机器人到复杂多智能体系统的开发,广泛应用于客服自动化、金融分析、供应链优化和医疗诊断等领域。本章基于最新研究,深入探讨LangChain的定义、核心功能、实现技术、优化策略、行业应用及未来趋势,重点分析其在复杂LLM应用中的优势与实践。其核心目标是简化LLM应用生命周期,包括开发、调试、优化和部署。是一个开源框架

#人工智能
5.6 Microsoft Semantic Kernel:专注于将LLM集成到现有应用中的框架

尽管存在文档和复杂性方面的挑战,SK的企业级特性和与Microsoft生态的深度集成使其成为构建智能应用的理想选择。它支持C#、Python和Java等多种编程语言,提供了轻量级、模块化的框架,用于构建智能代理(Agent)并实现AI与传统代码的协同工作。SK的核心目标是通过提供统一的AI编排层,简化企业在现有系统上引入LLM的复杂性,同时确保企业级可靠性、安全性和可扩展性。记忆机制通过与向量数据

文章图片
#microsoft#人工智能
LangChain 是什么?都用在什么场景

LangChain 是一个通用、模块化的框架,简化了基于 LLM 的应用程序开发,特别适合需要外部数据、工具调用或上下文记忆的场景。它在问答、智能体、对话系统、数据分析、文档处理、教育等领域有广泛应用。在 AI 教练培训平台中,LangChain 可构建知识库、开发智能体、支持多模态交互,与 AutoGen、LlamaIndex、LightRAG 结合可进一步提升功能。LangChain 的模块化

模型蒸馏:DeepSeek-R1-distill-llama-70B

蒸馏过程中,教师模型首先对输入数据生成输出概率分布,这些输出被称为“软目标”(soft targets)。生模型则通过学习这些软目标,来近似教师模型的行为。直接使用真实标签(硬目标)进行训练相比,软目标提供了类别之间更丰富的关系信息,有助于学生模型更好地泛化。模型蒸馏(Model Distillation)是一种模型压缩技术,旨在将一个复杂的大型模型(称为教师模型)的知识转移到一个较小的模型(称为

文章图片
#机器学习#深度学习#人工智能
部署open webui 调用ollama启动的deepseek

在模型选择框输入时,可通过。

文章图片
#eureka#云原生
在 Open WebUI + Ollama 上运行 DeepSeek-R1-70B 实现调用

Ollama 是一个本地化的大模型管理工具,它可以在本地运行 DeepSeek-R1-70B。默认情况下,Ollama API 监听 http://localhost:11434。提供了一个友好的 Web 界面来调用 Ollama 部署的模型。模型,并通过 Web 界面进行交互。以下是完整的部署步骤。如果安装成功,将返回 Ollama 的版本号。在终端中运行以下命令,下载。

怎么识别语音是不是孩子的声音的方法

摘要:语音年龄段识别可通过三种方式实现:1)直接调用云厂商API(如阿里云、腾讯云),快速判断儿童/成人语音;2)自建模型服务,使用ECAPA-TDNN提取声纹特征并训练分类器;3)高安全场景可组合年龄段识别、反欺骗检测和声纹验证。需注意音频质量(5-10秒清晰语音)、儿童发音特殊性及设备一致性等问题,建议根据业务需求选择方案,新上线时可考虑三档分级策略优化用户体验。

#语音识别#人工智能
怎么做一个应用测试:老外说中文说得准不准

本文系统介绍了中文口语自动评测(CAPT)的技术实现方案。核心采用标准文本与发音比对思路,通过ASR识别、强制对齐和音素比对计算发音准确度。特别针对中文特点,重点处理声母韵母混淆、声调识别等问题,并评估流利度和可理解度。文章推荐直接调用微软、阿里云等现成API实现快速部署,也详细讲解了自建系统的技术路线,包括ASR选型、对齐处理、GOP打分等关键环节。最后针对外语学习者提出优化建议,如母语特定错误

fastmcp2.0的传输方式

本文介绍了fastmcp 2.0中除STDIO和SSE外的专业传输方案,包括WebSocket(适合实时交互)、gRPC(适合微服务)、NATS(适合分布式场景)、QUIC(适合弱网环境)等。每种方案各有特点,适用于不同场景,如低延迟、强类型、高吞吐等需求。同时提出混合使用模式的可能性,并总结各方案的最佳适用场景,为生产环境提供多样化选择。

    共 321 条
  • 1
  • 2
  • 3
  • 33
  • 请选择