logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

告警至处置的自动化鸿沟:AI Agent 的破局思路探索

这套系统不是要替代安全工程师,而是接管那些"机械性的值班工作",持续监视、及时封禁、自动归档、按时巡检、定期出报告。让 AI 做 AI 擅长的事,让人做人擅长的事。35 万次暴力破解,AI 可以 24 小时不间断地逐条处理。但"这个告警是不是误报",“要不要通知业务方”,“这次事件暴露了什么架构问题”,这些判断,仍然需要安全工程师的专业经验。Sentinel 的定位是单机或小集群的 AI 值班副官

#自动化#人工智能#运维
校企联动 | 优刻得携手华中科技大学探索Agent推理基础设施新路径

与此同时,各种Agent应用所需的上下文越来越长,巨大的 KV Cache占用和受限的显存大小严重限制了推理的并发,这使得大模型推理正在从算力瓶颈变为显存瓶颈。通过分析现有的KV Cache卸载方案,我们发现KV Cache卸载到内存后,将重要 Token从内存加载到显存的同步IO严重影响了GPU利用率,导致卸载后的吞吐提升十分受限。优刻得与华中科技大学达成产学研合作,聚焦Agent场景下的大模型

文章图片
#人工智能#机器学习#自动化 +2
校企联动 | 优刻得携手华中科技大学探索Agent推理基础设施新路径

与此同时,各种Agent应用所需的上下文越来越长,巨大的 KV Cache占用和受限的显存大小严重限制了推理的并发,这使得大模型推理正在从算力瓶颈变为显存瓶颈。通过分析现有的KV Cache卸载方案,我们发现KV Cache卸载到内存后,将重要 Token从内存加载到显存的同步IO严重影响了GPU利用率,导致卸载后的吞吐提升十分受限。优刻得与华中科技大学达成产学研合作,聚焦Agent场景下的大模型

文章图片
#人工智能#机器学习#自动化 +2
告警至处置的自动化鸿沟:AI Agent 的破局思路探索

这套系统不是要替代安全工程师,而是接管那些"机械性的值班工作",持续监视、及时封禁、自动归档、按时巡检、定期出报告。让 AI 做 AI 擅长的事,让人做人擅长的事。35 万次暴力破解,AI 可以 24 小时不间断地逐条处理。但"这个告警是不是误报",“要不要通知业务方”,“这次事件暴露了什么架构问题”,这些判断,仍然需要安全工程师的专业经验。Sentinel 的定位是单机或小集群的 AI 值班副官

#自动化#人工智能#运维
告警至处置的自动化鸿沟:AI Agent 的破局思路探索

这套系统不是要替代安全工程师,而是接管那些"机械性的值班工作",持续监视、及时封禁、自动归档、按时巡检、定期出报告。让 AI 做 AI 擅长的事,让人做人擅长的事。35 万次暴力破解,AI 可以 24 小时不间断地逐条处理。但"这个告警是不是误报",“要不要通知业务方”,“这次事件暴露了什么架构问题”,这些判断,仍然需要安全工程师的专业经验。Sentinel 的定位是单机或小集群的 AI 值班副官

#自动化#人工智能#运维
星图AstraFlow首发上线DeepSeek-V4,性能比肩顶级闭源模型

优刻得星图AstraFlow平台第一时间上线DeepSeek-V4双版本模型。DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。**Agent 能力大幅提高:**相比前代模型,DeepSeek-V4-Pro的Agent能力显著增强。在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同

#人工智能#网络#服务器
优刻得携手朝阳永续联合主办国内首届AI Agents资产配置大赛,赋能金融科技创新

作为大赛联合主办方,优刻得致力于以智能算力赋能金融科技创新,为这场具有开创性意义的赛事提供全链路技术支撑,与朝阳永续共同推动AI技术在资产配置领域的深度应用。与传统模拟交易依赖人工看盘、手动下单不同,本届大赛要求参赛者派出AI智能体“小龙虾”,在真实证券市场仿真环境中进行完全自主的资产配置、选股、交易、调仓和发帖操作。截至目前,已有200余家金融机构、超900名从业者报名参赛,覆盖私募、公募、券商

文章图片
#人工智能#金融#科技
集团型企业为什么需要一朵“真正懂AI”的专有云?

AI浪潮正在以前所未有的速度重塑企业经营模式。从最初的“提效工具”,到如今驱动业务创新的核心引擎,AI正在成为企业数字化转型的新底座。越来越多企业发现:传统IT架构和传统云平台,已经难以承载新一轮智能化升级的需求。围绕企业在统一管控、边缘节点建设以及AI创新业务落地中的核心痛点,优刻得给出面向AI时代的专有云的新答案。

#人工智能
从“风冷时代”走向“液冷时代”:数据中心正在被重新定义

在AI大模型持续演进的今天,数据中心正迎来一次底层架构级的变革。在TechWeek上海站《液冷2.0:废热资产化与算点协同创新》论坛上,优刻得架构师徐智宇围绕“液冷技术在数据中心的应用与实践”进行了系统分享,从行业趋势、技术路线到规模化部署经验,深入解析了液冷如何成为AI时代算力基础设施的关键能力。过去,传统数据中心主要承载搜索、电商、社交等通用计算业务,CPU是核心算力单元,单机柜功率密度普遍在

#大数据#人工智能
    共 42 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择