logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

你应该懂的AI大模型之 Ollama

Ollama是一款简化大语言模型部署的开源工具,支持Llama2、Mistral等主流模型,通过命令行操作即可实现本地或远程服务器的一站式部署。文章详细介绍了远程部署Llama3的步骤,包括环境搭建、Ollama安装和模型验证。同时指出Ollama采用量化技术降低硬件要求,但精度有所损失,更适合个人开发者使用。相比而言,企业级应用更推荐vllm,因其具备高性能、扩展性和专业支持。不同用户需根据实际

文章图片
#人工智能
跟着 Nanogpt 实践 Transformer

摘要:Transformer核心机制通过query/key/value语义embedding实现上下文感知的动态表征。query与key计算相似度,经softmax加权后与value相乘,生成包含上下文信息的token表征。该设计解决了长距离依赖问题,并支持并行计算。位置信息通过embedding相加而非拼接引入,避免维度膨胀。NanoGPT实现中,采用多头注意力机制,先层归一化再计算注意力权重,

文章图片
#transformer#深度学习#人工智能 +3
cursor+figma-mcp-server实现LLM驱动设计UI原型图

本文介绍了如何利用AI编程软件Cursor和MCP技术实现文本到设计图的转换。作者通过Cursor-talk-to-figma-mcp项目,详细说明了在Mac和Windows系统下的配置流程,包括安装Bun工具、启动WebSocket服务、配置Figma插件等步骤。虽然最终生成的设计图效果不尽如人意,但成功验证了LLM借助MCPserver实现从文本到设计图的技术可行性。文章还对比了不同MCP服务

文章图片
#figma#ui#人工智能 +3
从源代码编译构建vLLM并解决常见编译问题

在通过创建全新虚拟环境条件下,使用方式安装VLLM后,遇到了VLLM使用方面的异常,经过多种方式尝试解决,最终无果。仔细查看官方文档后,发现其中有2段话尤为重要:1.如果使用的是不同的CUDA版本,或者想要使用现有的PyTorch安装,则需要从源代码构建vLLM。2.vLLM的二进制文件默认使用CUDA 12.1和公共PyTorch发行版本进行编译。另外还提供使用CUDA 11.8和公共PyTor

文章图片
#人工智能#深度学习#前端 +2
大语言模型:Ollama大语言模型运行器

是一个使用Go语言开发的的开源的本地大语言模型(LLM)运行框架,通过少量命令即可在本地机器上快速部署和运行大语言模型,Ollama支持在多个操作系统上运行,包括Windows、Linux和macOS。Ollama提供对模型量化的支持,可以显著降低显存要求,使得在普通计算机上运行大型模型成为可能。Ollama支持多种流行的开源大语言模型,可以根据自己的需求和硬件条件选择合适的模型进行下载和使用,完

文章图片
#语言模型#人工智能#自然语言处理
使用Llama-Factory进行模型训练与微调-环境准备与工具部署

本文介绍了在WSL环境下使用llama-factory进行大模型训练的完整流程。主要包括:1)安装WSL和Ubuntu;2)下载llama-factory项目;3)通过conda创建Python3.10运行环境;4)安装llama-factory及其依赖项;5)使用Qwen1.5-0.5B模型和内置数据集进行简单训练演示。文中详细说明了各步骤的具体操作命令和注意事项,特别针对安装过程中的常见问题提

文章图片
#开发语言#语言模型#人工智能 +2
深入了解如何通过 LM Studio 优化本地 LLM 性能

LMStudio是一款专为本地大语言模型设计的桌面工具,它简化了LLM在个人电脑上的部署和使用过程。文章介绍了LMStudio的三个核心优势:首先,它提供了一体化的本地LLM运行环境和直观的聊天界面,降低了技术门槛;其次,得益于与NVIDIA的合作,LMStudio整合了CUDA计算图优化、FlashAttention等性能加速技术;最后,软件提供免费跨平台支持,既适合普通用户直接交互使用,也支持

文章图片
#开发语言#人工智能#开源 +1
Coze智能体本地部署保姆级教程

AI智能体开发平台Coze(扣子)宣布开源,支持本地部署。文章详细介绍了Windows系统下的部署步骤:1)安装Docker环境;2)克隆GitHub项目;3)配置大模型服务(以火山方舟为例);4)通过Docker启动服务。针对Windows特有的Elasticsearch报错提供了解决方案(修改文件换行符)。虽然开源版本功能有所精简,但为开发者提供了自主开发基础,且本地部署适合新手练习,解决了在

文章图片
#人工智能#深度学习#自然语言处理 +2
Dify 1.7.0重磅更新:基于支持OAuth认证功能的插件开发GitHub智能体

Dify v1.7.0发布重大更新,重点增强插件系统的OAuth认证和自动升级功能。新版本支持标准OAuth2.0授权流程,无需暴露用户凭据,并实现token自动续期,大幅提升安全性。文中详细演示了如何基于GitHub插件开发智能体,包括环境配置、OAuth应用注册和智能体开发流程。此外还提供了完整的AI大模型学习资源包,包含学习路线图、视频教程、技术文档和面试题集,帮助开发者掌握大模型应用开发全

文章图片
#github#架构#人工智能 +2
手把手教你使用trae创建一个代码助手智能体

本文介绍了使用trae平台创建智能代码助手的完整流程。首先明确了助手需要具备理解需求、检索网页、生成示例代码等核心功能。然后详细讲解了通过MCP市场安装Context7工具的方法,以及智能体的创建步骤,包括角色定位提示词设计(资深工程师身份)、工作流设定(需求识别-文档拉取-代码生成三步骤)和拒绝场景定义。最后展示了如何使用该智能体进行代码分析,并总结了创建流程的三个关键环节:安装工具、配置智能体

文章图片
#人工智能#深度学习#机器学习 +3
    共 670 条
  • 1
  • 2
  • 3
  • 67
  • 请选择