logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI算力网络与通信:数据加密的关键所在

你是否遇到过这样的场景?手机拍一张照片上传云端,AI立刻识别出“这是一只橘猫”;工厂里的传感器实时上传数据,AI算法预测设备故障;甚至自动驾驶汽车与云端“商量”最佳路线……这些智能应用的背后,都依赖一张看不见的“AI算力网络”——它像一张大网,把手机、摄像头、服务器、云端的算力连接起来,协同完成计算任务。但问题也随之而来:当数据在这张大网中“跑来跑去”时,如何防止被“小偷”(黑客)截获?本文将聚焦

#人工智能#网络
英伟达H100的AI设计密码:AI应用架构师能复制的范式创新

当ChatGPT掀起生成式AI革命时,当GPT-4、Llama 2等大模型突破千亿参数门槛时,当自动驾驶、医疗影像等复杂AI应用需要实时推理时,算力不再是“辅助工具”,而是“AI应用的底层逻辑”。英伟达H100 GPU作为“AI时代的算力引擎”,其设计并非简单的性能堆砌,而是一套针对AI workload的范式创新——从计算单元的“精准打击”到内存系统的“物流优化”,从多任务的“资源共享”到精度的

#人工智能
AI原生应用在UGC内容审核中的实战经验

AI原生应用(AI-Native Application)——以机器学习模型为核心驱动力,深度整合数据、算法、工程架构的完整系统——为破解这一三角难题提供了全新范式。全链路数据驱动:从数据采集、模型训练到决策优化,形成闭环自治系统,无需人工规则干预多模态深度理解:同时处理文本、图像、音频、视频等多类型内容,理解语义而非简单匹配特征自适应进化能力:通过人机协同反馈持续学习新型违规模式,模型周级迭代成

AI原生应用领域函数调用的团队协作开发模式

传统软件开发团队通常按“前后端+测试+产品”分工,但函数调用开发需新增AI相关角色,并重新定义职责边界。基于多家AI原生企业(如OpenAI、Anthropic、国内某头部LLM应用公司)的实践,我们总结出**“5+1”核心角色模型**:5个专职角色(覆盖技术开发全流程)+1个协调角色(保障跨角色协作)。

告别臃肿模型!AI原生应用轻量化之模型蒸馏完全指南

2023年11月,一位资深AI工程师在社交媒体上吐槽:"我们训练的最新NLP模型需要8张A100显卡才能勉强运行推理,而客户的边缘设备只有2GB内存。这种’实验室AI’与’现实世界’的鸿沟正在扩大。。从2018年BERT的1.1亿参数,到2020年GPT-3的1750亿参数,再到2023年各类千亿、万亿参数模型的涌现,AI模型正陷入一场"参数军备竞赛"。"我们已经进入了一个矛盾的时代,"斯坦福大学

#人工智能
大模型+项目文档管理:AI应用架构师如何用AI自动整理文档?

作为AI应用架构师,你是否曾被以下问题困扰?项目文档散落在Confluence、Notion、本地文件夹和Slack聊天记录里,找一份“用户登录流程”要翻3个平台?需求文档更新后,没人同步到技术文档,导致开发和产品出现理解偏差?新人入职时,要花3天才能理清“系统权限设计”的前因后果?想快速查询“支付回调异常处理方案”,却因为关键词不对找不到相关内容?传统项目文档管理的核心痛点,本质是**“非结构化

AI应用架构师如何设计基于大模型的智能风控平台?

开篇:金融科技的新引擎与风控的“阿喀琉斯之踵”“据不完全统计,2023年全球金融欺诈损失超过4000亿美元,而传统风控系统的识别率不足60%。” —— 当这样一组数据摆在面前,每一位金融从业者都会感到沉重。在数字经济飞速发展的今天,金融服务日益普惠,交易场景愈发复杂,欺诈手段也呈现出智能化、隐蔽化、跨境化的新趋势。传统基于规则引擎和传统机器学习模型的风控体系,正面临着前所未有的挑战:规则滞后、难以

#人工智能
AI应用架构师揭秘:自动驾驶的「冗余系统架构」,如何让车「不抛锚」?

从硬件冗余的“物理隔离”,到软件算法的“智能表决”,再到故障管理系统的“毫秒级响应”。传统汽车的安全目标是“避免硬件故障导致的事故”(功能安全,ISO 26262),而自动驾驶在此基础上,还需应对“AI算法局限性导致的事故”(预期功能安全,ISO 21448)。:主MCU采用高性能AI芯片(如NVIDIA Orin,200TOPS算力)运行复杂感知算法,辅MCU采用高可靠嵌入式芯片(如TI TDA

5个真实案例:提示工程架构师用上下文工程优化心理健康AI对话系统

情感上下文需要**“标签化+强度量化”**(如“焦虑(8/10)”),而不是简单的“情绪分类”;提示词中必须明确“关联历史情感”的要求,否则模型会忽略上下文;情感分析模型需选择细粒度情绪分类(如“烦躁”“绝望”),而非粗粒度(如“负面情绪”)。跨会话上下文需要**“持久化+摘要化”**:持久化保证数据不丢失,摘要化保证模型能快速处理;摘要生成需遵循**“心理治疗逻辑”**(如将“加班太多”总结为“

用D3.js实现高级大数据可视化的10个案例解析

最终效果:缩放全国时显示热力图(1秒加载),缩放至街道时显示100万+点的点云(无卡顿)。大规模空间数据的可视化,本质是“数据分级+渲染加速”——SVG适合小数据,WebGL适合大数据,D3的地理工具链(d3.geo)能完美衔接两者。最终效果:200万节点+500万边的网络,能在3秒内完成布局,动态演化时无卡顿。网络可视化的关键是“降维计算”——Barnes-Hut算法把“全量计算”变成“近似计算

    共 274 条
  • 1
  • 2
  • 3
  • 28
  • 请选择