logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Dexmal 原力灵机开源 Dexbotic:具身智能的“Transformers“库来了

现在 AI 能写代码、能画画,但你有没有想过,让 AI 去拧个瓶盖,为什么就这么难?因为拧瓶盖这件事,需要三个能力同时在线:眼睛-视觉(ision): 它得先看懂——哪个是瓶子?哪里是盖子?盖子纹理是什么样?大脑-语言(anguage):它得理解人类的指令——“拧开瓶盖”是什么意思?是顺时针还是逆时针?用多大力?身体-动作(ction):它得精确地执行——手指要以多大角度抓住瓶盖?施加多大扭矩?这

#人工智能#大数据
英伟达最强AI芯片GB200被曝故障,微软谷歌Meta 大规模退单,改购H200

受芯片禁令的影响,国内很多小伙伴对大模型训练部署的 GPU 型号感知可能还停留在 H100 甚至 A100 上面。但其实在 H100 之后,不仅诞生了同样是 Hopper 架构的 H200 芯片(于 2023 年底发布),而且 2024 年上半年,英伟达还发布了超越 Hopper 架构的全新 Blackwell 架构。搭载最新 Blackwell 架构的 GPU 芯片,便是 B200。,如下图所示

文章图片
#人工智能
快手用生成式重做了搜索,都藏在这两篇论文里

当所有人都在讨论"大模型能做什么"的时候,大部分答案都指向:生成文本、写代码、做助手。仿佛生成式 AI 的全部价值就是"替代人类生产内容"。但快手这个案例让我看到了完全不同的可能性:生成式 AI 不一定要生成内容,它可以用来重构系统架构。UniDex 和 UniSearch 的核心都是“统一”——统一的语义空间、统一的优化目标、统一的训练框架。端到端优化,消除系统内耗,这应该是工业级系统的护城河。

#人工智能
AI唱中文歌,终于不怪了!

就在刚刚,昆仑万维发布了 Mureka V7.5,一个专门为中文升级的音乐大模型。老实说,这两年AI做音乐已经卷出了天际——Suno、Udio、Riffusion,一个比一个能唱,特别是英文歌,人声真假难辨,节奏旋律也都挑不出太大毛病。所以当我看到 Mureka 这个更新的时候,原本也没太在意。直到我注意到一件事:和很多模型强调“多语言支持”“风格多样化”不同,Mureka 这次反而把重点放在了「

文章图片
#人工智能
灵启 AI 小盒子-桌面级AI Lab实测:千亿大模型开箱即跑,这个小盒子有点猛

等等!马上要进入 2026 年了,你还在和大模型部署扯皮吗?尤其是个人开发者和小团队,只是想跑个模型,为什么要经历九九八十一难啊?!配环境翻车、显存溢出报错、依赖冲突爆炸、模型下载失败……这种痛感你我都懂。所以,当一台自称的小盒子端上来,宣称的时候,我第一反应是:想法很美好,但别吹太过了。但第二反应又是:如果它真的能做到,那真的喜上加喜。一个是 AI infra 圈里以「降低算力使用门槛」著称的公

#人工智能
DeepSeek V3.2的隐藏更新,却意外暴露了MiniMax

就在本周,DeepSeek V3.2 正式上线。当天我写了一篇分析,提到了这次技术上可能被忽视的突破:一个是 DSA 稀疏注意力,另一个是思考模式的工具调用的突破。显然评论区的小伙伴对第二个讨论更激烈。没错,是 DeepSeek 的首次,但不是行业的首次。评论区有人直接不服点名 minimax、gemini、claude、o3 就已经支持了。

#人工智能
阿里千问 APP 来了,对标 ChatGPT,配吗?

阿里发布千问 APP,正式开启公测。这个消息我上周已经刷到了——“阿里秘密启动千问项目,全面对标 ChatGPT ”,甚至还带动了阿里港股小涨一波。周末我发现 APP Store 里已经开放下载,于是花了两天时间密集测了一圈。有个有趣的发现:当所有人都在 AI 应用里堆功能的时候,阿里反而做起了减法。

#人工智能
GPT-5.2 正面对狙 Gemini 3 Pro,但真正杀手锏不在跑分

今天凌晨,OpenAI 放出了他们对 Gemini 3 Pro 的正面反击——GPT-5.2。但说实话,现在再用“更聪明”这种词去夸一个大模型,真的没什么意思了。我看下来,GPT-5.2 真正让我眼前一亮的,是它什么意思?过去的模型,有时候就像刚毕业的小朋友,思路飞快,但节奏全靠撞。你让它帮忙写个方案,它啪一顿输出,看着热闹,细看全是漏洞,逻辑跳着走,格式乱飞,最后还得你一段段返工、整理、手动修。

#人工智能
Qwen3 终于来了!全面超越 DeepSeek R1,原生支持 MCP

综合来看,Qwen3 的发布不仅是一次榜单突破,我觉得更是国产 AI 大模型从“对话”走向“执行”的一次关键跃迁。无论是全面超越 DeepSeek R1 的硬核性能,还是原生支持 MCP 协议的 Agent 能力,亦或是混合推理机制和超低部署成本,Qwen3 都展现了一次恰到好处的升级迭代。未来,随着 Agent 时代的加速到来,Qwen3 或许将成为推动 AI 应用落地的核心引擎。我们拭目以待。

#人工智能
2022年薪百万赛道:高性能神经网络与AI芯片应用

随着大数据的发展,计算机芯片算力的提升,人工智能近两年迎来了新一轮的爆发。而人工智能实现超级算力的核心就是AI芯片。AI芯片也被称为人工智能加速器,即专门用于处理人工智能应用中的大量计算任...

#神经网络#算法#人工智能 +1
    共 804 条
  • 1
  • 2
  • 3
  • 81
  • 请选择