logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【无标题】

Redis 8重磅推出Vector Set向量数据类型,让智能搜索触手可及!本文从"快递包裹"类比解释向量原理,到Redis与Milvus对比,再到构建商品推荐系统的完整实战。通过10+个Redis命令示例,手把手教你实现从商品向量存储、用户行为记录到精准推荐的闭环。无需额外部署,直接利用现有Redis实例,响应速度提升3倍,推荐准确率从40%提升至85%+。立即掌握AI应用必备技能,让推荐系统真

#redis
【人工智能】【大模型训练】② AI解剖室GPipe & PipeDream:解剖大模型训练的“卡顿病灶“

大模型训练常因"卡顿"导致效率低下。GPipe和PipeDream通过创新的流水线并行技术,将训练过程转化为"智能交通系统"。GPipe引入microbatch切割,PipeDream则通过weight stashing和vertical sync实现零等待,使GPU利用率从65%提升至92%,训练速度提升50%。本文以"手术室"比喻深入浅出解析这些关键技术,助你理解如何让大模型训练"纵享丝滑"。

#人工智能
【人工智能】【AI外呼】⑥ 存储架构揭秘:如何用异构数据库支撑每日百万级智能外呼?

在日均百万级AI外呼场景下,单一数据库难以兼顾性能、成本与灵活性。本文基于多年金融与电商外呼系统实战经验,详解如何通过异构存储架构高效支撑高并发、多场景业务:PG库 管理事务型任务元数据(按月分表,单表亿级);Redis 缓存实时会话上下文(可供ASR/TTS共享);MongoDB 存储灵活对话日志(大JSON、长期留存、BI友好);结合 Caffeine 本地缓存降低Redis压力,并通过自动化

#人工智能#数据库
【向量数据库】Milvus向量数据库 ② Java访问Milvus工具类的设计与实现

基于最新的 MilvusClientV2 客户端重新设计了一套工具类,本文将详细介绍其实现细节。

#数据库#milvus#java
【AI 微服务】使用 Spring Boot 调用 DeepSeek API:非流式实现

本文介绍了如何使用 Spring Boot 调用 DeepSeek API,给出了模型非流式返回时的实现代码;文末还给出了后续的改进建议

文章图片
#spring boot#后端
【人工智能】【大模型】验证大模型效果的终极指南:从人工验证到自动化平台实践

本文解析了大模型训练-验证全流程,采用自动化(准确率/F1分数)与人工验证(客服对话评分)结合的方法。作者搭建的模型训练平台支持LoRA/Full/Freeze等主流微调方式,覆盖数据预处理、训练、部署全链路。文章对比了不同微调方法的参数量/成本/性能平衡,并指出AI评估向多维度(公平性/安全性)、实时化发展的趋势。适合开发者掌握大模型落地实践。

#人工智能#自动化
【人工智能】【应用】AI Agent的商业化价值:从Archy到Parahelp的行业应用全景

本文深入剖析AI Agent从概念走向商业落地的关键转折点,聚焦Archy(牙科云操作系统)与Parahelp(智能客服Agent)两个近期均完成约斩获高额融资的标杆案例,系统梳理其在效率提升、成本节约与用户体验优化上的真实价值。文章结合制造业、医疗健康等行业的应用实践,揭示AI Agent通过自主性、反应性、社会能力和主动性四大核心能力创造商业回报的路径,并融入“技术要扎到土地里”的务实观点,强

#人工智能
【人工智能】【AI外呼】⑦ AI外呼系统接通率深度解析:从20%到60%的实战指南

本文深入剖析AI外呼系统接通率的核心影响因素与优化策略,结合金融、电商、教育等真实行业案例,从号码选择、线路规避、TTS/ASR调优到交互体验设计,提供一套可落地的技术方案。文中包含具体代码示例、网络架构图及运营商限制应对方法,帮助初创团队和缺乏经验的开发者避开常见陷阱,实现接通率从20%+到60%+的显著提升。所有数据与方案均源于生产环境实践,并附有系列文章导航,便于系统性掌握AI外呼全栈技术。

#人工智能
【人工智能】【阿里云百炼平台】 ① 大模型全景图:从文本到全模态,一张图看懂AI能力边界(2025版)

本文介绍了一个简洁实用的 Flask API 示例,可对接阿里云通义万相实现商品查询与文生图功能。代码含完整 main 函数,支持 GET 查询商品、POST 传入 prompt 模拟图像生成,可直接运行测试。示例展示了如何用 Python 快速搭建可集成至实际项目的后端服务,适合开发者快速上手百炼平台应用开发。

#人工智能#阿里云#云计算
【人工智能】【大模型】DeepSeek开年重磅:mHC架构,如何让大模型训练不再“炸机“?

mHC通过将多路残差流权重约束于双随机矩阵流形,解决HC的数值不稳定性问题。双随机矩阵(行/列和为1)确保信号范数恒定,避免梯度爆炸。核心采用Sinkhorn-Knopp算法:对任意矩阵指数化后,20次交替行/列归一化生成双随机矩阵。计算高效(20次迭代),平衡ResNet的稳定性与HC的表达力,显著提升深度学习模型的稳定性。

#人工智能
    共 94 条
  • 1
  • 2
  • 3
  • 10
  • 请选择