logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型部署Ollama和vLLM:Ollama是什么?vLLM是什么? 分页注意力机制是什么?

Ollama是一款专注于简化大型语言模型本地部署和运行的开源框架,基于Go语言实现,支持跨平台运行,并以“开箱即用”为核心理念,适合个人开发者和轻量化场景。而vLLM是一个高效的大模型推理与服务引擎,基于PyTorch构建,创新性地引入了PagedAttention技术,旨在解决大模型服务中的显存效率与吞吐量瓶颈,支持张量并行和流水线并行,可横向扩展至多机多卡集群。

文章图片
#人工智能#自然语言处理#语言模型
LLM推理引擎“三国杀”!Transformers、llama.cpp、vLLM巅峰对决,谁才是真正的性能之王?

大家在尝试部署本地大型语言模型(LLM)时,面对 `llama.cpp`、`vLLM`、`Ollama` 等 LLM 领域技术名词,往往感到困惑:它们是对开发者透明的工具,还是有必要优化的技术?

文章图片
#服务器#网络#c# +1
大模型的部署方法四:使用LM Studio部署

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频,免费分享!

文章图片
#人工智能#AI#学习
大模型推理框架选型指南,vLLM、SGLang、lmdeploy深度对比与实战

框架主要特点适用场景优势劣势vLLMPagedAttention,极致性能高并发文本生成API服务吞吐率高,延迟低,硬件利用好灵活性和扩展性有限SGLangDSL推理编排,复杂流程控制复杂对话、结构化输出、业务逻辑定制灵活度高,推理流程编程式控制学习曲线陡峭,性能稍逊lmdeploy多后端支持,轻量快速部署多硬件环境快速上线多后端兼容,集成度高控制能力较弱FastChat聊天机器人专用多轮聊天应用

文章图片
#人工智能#vLLM
重磅警告:你的Ollama正在被全球“白嫖“?深度解析Ollama安全风险与防护方案

Ollama的安全问题提醒我们,在追求便利的同时不能忽视安全防护。通过本文提供的方案,您可以既享受Ollama带来的便利,又确保系统安全。建议所有Ollama用户立即检查自己的部署情况,采取必要的防护措施。作者注:本文仅供技术研究和安全防护参考,请勿用于非法用途。

文章图片
#安全#人工智能#自然语言处理 +2
大模型LLM开源框架 | 使用LLaMA-Factory快速训练自己的专用大模型

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

文章图片
#开源#人工智能
大模型经典著作《大语言模型基础与前沿》(附完整版PDF)

熊博士曾在多家中美知名高科技公司担任高级管理职位和首席科学家,在人工智能的多个领域,包括大语言模型、图神经网络等从事研发和管理工作多年。

文章图片
#语言模型#人工智能
大模型调用MCP工具竟浪费这么多Token?代码执行模式拯救AI原生应用

本文探讨MCP协议在大模型智能体应用中面临的Token消耗过量问题,提出通过代码执行模式替代直接工具调用。该方法让智能体按需加载工具定义、在执行环境中处理数据后再返回结果,将Token消耗降低98.7%。代码执行还提供了渐进式工具暴露、高效结果处理、强大控制流、隐私保护和状态持久化等优势,帮助开发者构建更高效的AI原生应用,但需权衡安全执行环境的实现成本。

文章图片
#人工智能#github#架构 +2
震惊!2025年AI编程助手已能写代码,程序员们慌了吗?盘点豆包、通义千问、WPS AI谁是开发者的最佳拍档!

当清晨的第一缕光透过窗帘,一位懂你日程、知你冷暖的“AI伙伴”也开始了一天的工作。一杯咖啡氤氲的香气里,行程梳理妥当,甚至晨会的简短发言提纲也已拟好;通勤路上,昨晚未看完的项目文档转化为语音播报,自动标注出关键数据;在工位前,面对庞杂的数据报表,秒级生成可视化图表;下午和客户见面前,输入核心思路,它快速生成PPT初稿,还匹配符合品牌调性的排版与配图;回家途中,语音告知晚餐需求,它会推送适配食材库存

文章图片
#人工智能#react.js#架构
鸿蒙来袭,抓牢“薪”风向标,程序员们,该上车啦!

在技术的浪潮中,总有一些关键时刻能够决定一个程序员职业生涯的走向。随着华为宣布今年下半年全面转向自主平台HarmonyOS,并放弃Android系统,这样的机遇已经到来。最新消息显示,最新版HarmonyOS将与华为Mate 70旗舰系列一同亮相,而国内常用的5000个应用中已有4000个完成了鸿蒙系统的适配。更令人振奋的是,鸿蒙系统在全球市场的份额在第四季度已经达到了4%,相关岗位薪资高且人才难

文章图片
#harmonyos#华为#鸿蒙 +1
    共 1347 条
  • 1
  • 2
  • 3
  • 135
  • 请选择