太空蚁007 个人主页

@xiezhiyi007

太空蚁007

2023-04-18 12:25:53 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【人工智能】【大模型】从厨房到实验室：解密LLaMA架构如何重塑大模型世界

本文以厨房烹饪类比，精解LLaMA三大核心创新：归一化革命（Pre-norm+RMSNorm）、SwiGLU激活函数、RoPE位置编码。对比LLaMA3.2、Grok-3、Qwen4与Gemini 2.0（截至2025年12月），揭示其如何成为85%开源大模型的“标准底盘”。含核心代码与前瞻展望，助你轻松掌握现代大语言模型设计精髓，AI学习者与从业者皆宜。

#人工智能 #架构

【人工智能】【大模型】AI编程的规范驱动革命——OpenSpec深度解析与金融行业实战全景

还在为AI生成的代码反复返工而焦虑？本文深度揭秘OpenSpec——让AI编程从“猜谜”走向“下棋”的规范驱动革命！通过结构化YAML/JSON规范，将模糊需求转化为机器可验证的“施工图纸”，结合某保险公司数据库工具组实战案例（模拟），展示如何将SQL高风险识别准确率提升至92%、网关配置错误骤降82%。涵盖核心流程、Gemini集成、金融行业落地全景、避坑指南与经典文献，手把手教你构建“规范即代

#人工智能 #金融

【人工智能】【大模型训练】④ 显卡基础知识｜英伟达算力开挂的GPU！从“厨房助手“到“AI引擎“

在AI训练的"厨房"里，GPU是高效厨师助手，比CPU快10倍！2026年，英伟达B100成绝对主流，单卡算力飙升。训练300B参数的Qwen3仅需1024张B100，2周搞定（A100需100小时，B100仅30小时，提速3.3倍）。从A100的"普通轿车"升级到B100的"超跑"，大模型训练从"慢工出细活"跃变为"快马加鞭"。算力正成为AI时代的"新石油"，而GPU正是拧紧地基的那颗螺丝。

#人工智能 #GPU

【后端】【Redis】① Redis8向量新特性：从零开始构建你的智能搜索系统

Redis 8重磅推出Vector Set向量数据类型，让智能搜索触手可及！本文从"快递包裹"类比解释向量原理，到Redis与Milvus对比，再到构建商品推荐系统的完整实战。通过10+个Redis命令示例，手把手教你实现从商品向量存储、用户行为记录到精准推荐的闭环。无需额外部署，直接利用现有Redis实例，响应速度提升3倍，推荐准确率从40%提升至85%+。立即掌握AI应用必备技能，让推荐系统真

#redis

【人工智能】【大模型训练】② AI解剖室GPipe & PipeDream：解剖大模型训练的“卡顿病灶“

大模型训练常因"卡顿"导致效率低下。GPipe和PipeDream通过创新的流水线并行技术，将训练过程转化为"智能交通系统"。GPipe引入microbatch切割，PipeDream则通过weight stashing和vertical sync实现零等待，使GPU利用率从65%提升至92%，训练速度提升50%。本文以"手术室"比喻深入浅出解析这些关键技术，助你理解如何让大模型训练"纵享丝滑"。

#人工智能

【人工智能】【AI外呼】⑥ 存储架构揭秘：如何用异构数据库支撑每日百万级智能外呼？

在日均百万级AI外呼场景下，单一数据库难以兼顾性能、成本与灵活性。本文基于多年金融与电商外呼系统实战经验，详解如何通过异构存储架构高效支撑高并发、多场景业务：PG库管理事务型任务元数据（按月分表，单表亿级）；Redis 缓存实时会话上下文（可供ASR/TTS共享）；MongoDB 存储灵活对话日志（大JSON、长期留存、BI友好）；结合 Caffeine 本地缓存降低Redis压力，并通过自动化

#人工智能 #数据库

【向量数据库】Milvus向量数据库 ② Java访问Milvus工具类的设计与实现

基于最新的 MilvusClientV2 客户端重新设计了一套工具类，本文将详细介绍其实现细节。

#数据库 #milvus #java

【AI 微服务】使用 Spring Boot 调用 DeepSeek API：非流式实现

本文介绍了如何使用 Spring Boot 调用 DeepSeek API，给出了模型非流式返回时的实现代码；文末还给出了后续的改进建议

#spring boot #后端

【人工智能】【大模型】验证大模型效果的终极指南：从人工验证到自动化平台实践

本文解析了大模型训练-验证全流程，采用自动化（准确率/F1分数）与人工验证（客服对话评分）结合的方法。作者搭建的模型训练平台支持LoRA/Full/Freeze等主流微调方式，覆盖数据预处理、训练、部署全链路。文章对比了不同微调方法的参数量/成本/性能平衡，并指出AI评估向多维度（公平性/安全性）、实时化发展的趋势。适合开发者掌握大模型落地实践。

#人工智能 #自动化

【人工智能】【应用】AI Agent的商业化价值：从Archy到Parahelp的行业应用全景

本文深入剖析AI Agent从概念走向商业落地的关键转折点，聚焦Archy（牙科云操作系统）与Parahelp（智能客服Agent）两个近期均完成约斩获高额融资的标杆案例，系统梳理其在效率提升、成本节约与用户体验优化上的真实价值。文章结合制造业、医疗健康等行业的应用实践，揭示AI Agent通过自主性、反应性、社会能力和主动性四大核心能力创造商业回报的路径，并融入“技术要扎到土地里”的务实观点，强

#人工智能

共 95 条

请选择