
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
是一个快速搭建 Web 应用的 Python 库,特别适合机器学习和 AI 相关项目。它允许开发者仅用几行 Python 代码,就能创建交互式的用户界面。你不需要写 HTML、CSS 或 JavaScript,也不需要进行前端开发,从而可以专注于项目的核心功能。而且,Streamlit 已经为创建 AI 聊天应用提供了内置支持。

接下来跟着我实操,只需要3步,就可以在本地完成Qwen3的微调。而且全过程零代码,提供webui界面操作

阿里百炼推出业界首个全生命周期MCP服务,支持一键部署、可视化构建Agent应用。文章通过天气查询智能体案例,详细展示了5步快速搭建流程:进入平台、创建应用、输入提示词、部署MCP服务、发布应用。整个过程仅需2分钟,无需复杂配置,内置多种MCP Server开箱即用,极大降低了AI应用开发门槛,让普通用户也能轻松创建专业级智能应用。MCP 确实好用,能让大模型调用各种工具和资源,仿佛变得无所不能,

DeepSeek R1 大模型微调 GPU 怎么选?从 7B 到 671B 参数适配指南

目前本地部署的 Deepseek R1 的 1.5B 等小参数模型基本是将推理能力提炼到 Qwen 或 Llama 的蒸馏版本,性能是远远比不上官网的版本的,你可以根据你自身的情况判断是否需要本地部署。

一文搞清楚大模型token分词和词向量,看这一篇就够了!

在分析Transformer模型参数之后,我们更加清晰地理解了这种架构及其工作原理。Transformer模型以其独特的多头自注意力机制和前馈网络,有效地处理序列数据,并在捕捉复杂的依赖关系方面表现出卓越的性能。每层编码器和解码器都集成了多头自注意力、前馈网络以及规范化层等关键组件。此外,通过维持一致的维度 和实施残差连接,模型确保了信息在层间的顺畅传递,同时也有效防止了在深层网络中常见的梯度消失

一文读懂大模型推理部署框架:vLLM/SGLang/TensorRT-LLM/ollama/XInference 对比

RAG技术原理深度解析:11张图示拆解从知识检索到智能生成的全流程

Agent是指一种能够感知环境、做出决策并采取行动以实现特定目标的自主实体。AI Agent的复杂程度各不相同,既有仅对刺激做出反应的简单反应式智能体,也有能够随时间推移不断学习和适应的高级智能体。Reactive Agents:直接响应环境变化,不具备内部记忆。Model-Based Agents: 利用内部世界模型进行决策的智能体。Goal-Based Agents: 以实现特定目标为基础规划








