logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

在 VS Code 中,一键安装 MCP Server!

MCP Server 开发者可以在网页上提供一个 Install 的按钮,让 end user 有一个一键安装的体验!其实,现在不少 MCP Hosts/Clients 对于安装/配置 MCP Server,都是基于一个 JSON 的配置文件。经过之前两篇文章的介绍,相信不少童鞋已经用上甚至开发起了第一个 MCP Server。那么,你也许会问,如果你也有一个 MCP Server 的话,应该如果

Tensorflow基础:实现手写字体识别

TensorFlow是由Google开发的一个开源机器学习框架,它广泛应用于计算机视觉、语音识别、自然语言处理等众多领域。TensorFlow 2.x版本尤为受到推荐,因为它提供了更为简洁、易用的API,同时也支持了即时执行(eager execution)模式,使得调试和学习变得更加容易。# 示例:TensorFlow的即时执行# 创建一个常量张量print("打印张量值:\n", tensor

WebRTC技术实现的简单视频聊天程序设计

HTML5提供了强大的多媒体处理能力,从内容展示到捕捉,再到更高级的编辑和处理功能,它都能够满足开发者的需求。理解并掌握这些技术,对于创造富有吸引力和交互性的Web应用至关重要。本章介绍了HTML5多媒体内容的展示与捕捉的基础知识,并通过实例演示了如何在实际开发中使用这些功能。随着技术的不断演进,我们期待HTML5在多媒体处理领域提供更多的可能性。函数可以通过关键字function、箭头函数(ES

Android UI设计与开发全面指南

Android用户界面(UI)是用户与应用程序交互的最直观媒介。UI系统负责显示和管理应用的所有视图和控件,包括按钮、文本框、列表等。为了设计出直观、易用且美观的应用界面,开发者需要深入理解Android UI系统的核心组件及其使用方式。Android UI的核心组件主要包括以下几种:Activity:应用中的一个单独屏幕,用于承载用户界面,管理生命周期。Fragment:可复用的UI模块,能够在

ComfyUI与Hugging Face模型库对接实践:一键拉取最新模型

本文介绍如何通过自定义节点将ComfyUI与Hugging Face模型库对接,实现模型的按需下载与自动加载。系统采用远程调用结合本地缓存机制,提升模型管理效率,确保环境一致性,适用于个人创作与团队协作场景。

#ComfyUI
大模型微调需要多少Token?我们用Llama-Factory算给你看

本文通过LLama-Factory框架,结合实际配置详解大模型微调所需的Token数量。重点分析有效训练Token的计算方式,涵盖数据量、batch size、梯度累积和epoch等因素,并给出100万至1000万Token的实践建议,帮助开发者科学规划微调任务。

HuggingFace模型如何通过vLLM实现极速推理?

本文介绍如何使用vLLM提升HuggingFace大模型的推理性能,重点解析PagedAttention、连续批处理和显存优化技术,实现吞吐量提升8倍以上,支持高并发、低延迟的生产级部署,助力大模型从实验室走向实际应用。

ChatGLM合同审查本地部署

本文探讨ChatGLM在合同审查中的本地化部署与应用,涵盖模型原理、微调技术、系统构建及安全合规等关键环节,提出基于LoRA的高效微调与端到端自动化审查系统架构。

谷歌Gemini影视剪辑效率提升方案

谷歌Gemini通过多模态AI技术革新影视剪辑,实现智能语义解析、自动化初剪与人机协同,显著提升创作效率与叙事连贯性。

基于vLLM的大模型API服务搭建全流程教学

本文详细介绍如何使用vLLM构建高性能大模型API服务,涵盖PagedAttention与连续批处理核心技术,提供从本地推理到OpenAI兼容API部署的全流程实战代码,并给出生产级架构设计、弹性伸缩、监控安全等关键建议,显著提升推理吞吐与显存利用率。

    共 110 条
  • 1
  • 2
  • 3
  • 11
  • 请选择