惜尔乀个人主页

@xi_er985

惜尔乀

2023-08-12 22:18:57 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Cursor从入门到精通：AI编程助手完全指南

Cursor是一款基于AI的代码编辑器，它集成了GPT-4、Claude等大语言模型，能够：- 🚀 智能代码补全- 💬 自然语言生成代码- 🔍 代码解释和重构- 🐛 Bug自动修复## 二、核心功能详解### 1. 智能补全（Copilot++）## 四、效率对比| 任务 | 传统方式 | 使用Cursor | 效率提升 ||------|----------|------------|-

#log4j

5分钟搭建企业级AI知识库：从零到一实战教程

# 三、优化技巧### 1. 混合检索结合关键词检索（BM25）和语义检索（向量），效果提升30%+。：统计高频问题，优化知识库## 五、效果展示| 指标 | 传统搜索 | AI知识库 ||------|----------|----------|| 回答准确率 | 60% |：LangChain / LlamaIndex## 二、快速实现### Step 1：环境准备。#AI知识库 #大模型 #

#人工智能

DeepSeek-V5多模态大模型深度实战：从API调用到视频理解，一篇就够了

DeepSeek-V5的发布，标志着国产大模型在技术实力上正式追平国际顶尖水平。对开发者来说，这意味着更低的成本、更强的能力——现在入手正当时。#DeepSeek #多模态大模型 #AI实战 #Python。

#音视频

DeepSeek-V5多模态大模型深度实战：从API调用到视频理解，一篇就够了

#音视频

OpenAI GPT-5重磅发布！百万Token上下文+实时搜索，Python实战调用指南

GPT-5预览版的到来，标志着大模型从"对话工具"正式进入"生产力平台"阶段。百万级上下文让代码库理解、长文档分析成为可能。内置搜索让AI真正保持实时性。建议：现在就用API接入体验，先做原型验证，等正式版发布后再投入生产。#GPT5 #OpenAI #Python #AIAgent #大模型实战。

#python #java

阿里Qwen3.5-32B MoE架构深度实战：混合专家模型原理与本地部署指南

MoE训练中最臭名昭著的问题是Expert Collapse（专家坍缩）——大部分Expert偷懒不干活，少数几个Expert累死。Auxiliary Loss（辅助损失函数）：额外惩罚路由不均衡的情况Z-Loss（零均值损失）：防止Expert的输出值过大导致训练不稳定实际训练中，这个辅助损失确保16个Expert的负载偏差不超过正负5%。Qwen3.5-32B代表了当前MoE路线的最高水平——

#架构 #php #开发语言

通义千问 Qwen3-72B 开源：API 迁移实战与多模型对比分析

阿里云开源通义千问Qwen3-72B模型，API定价降至0.8元/百万tokens。该72B参数Dense架构模型在中文评测(C-Eval 87.2%)表现优异，接近GPT-4o水平。提供三种部署方案：API调用(¥0.8/1M tokens)、vLLM生产部署(2x A100约¥50-80/天)和Ollama本地运行。通过兼容OpenAI接口实现无缝迁移，电商客服案例显示月成本可从GPT-4o的

#开源 #人工智能

DeepSeek-R2 炸裂开源：131B MoE 架构如何吊打国际模型？国产大模型三强横评

摘要： 2026年5月，DeepSeek开源R2系列大模型（131B MoE架构和13B精简版），48小时下载量破50万，MMLU达92.1%。R2采用分层路由MoE设计，激活参数仅22B，推理速度提升3倍，API成本降低40%。与同期发布的Qwen3-72B和GLM-5-272B相比，R2在性能、价格和长文本处理（128K上下文）上表现均衡。国产模型API成本仅为国际模型的1/10-1/50，开

#开源 #架构

清华智谱GLM-6开源！手把手教你搭建企业级AI Agent工具链

GLM-6的开源让中国企业级AI Agent落地有了新选择。免费、可控、中文强，这三个关键词足以让它成为国内开发者的首选基座模型。未来趋势：开源模型+商业API的混合架构将成为主流。用GLM-6做核心逻辑，用GPT-5做创意发散，两者互补才是最优解。#GLM6 #智谱AI #开源大模型 #AI Agent #企业级应用。

#开源 #人工智能

DeepSeek-R2 炸裂开源：131B MoE 架构如何吊打国际模型？国产大模型三强横评

#开源 #架构

共 13 条

请选择