
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
昨天半夜刷到 MiniMax 又搞事情了,这次轮到音乐大模型升级。说实话,看到这个消息我第一反应不是“哇好厉害”,而是想到一个问题:中国在声音这个赛道上,要翻身了。前段时间 MiniMax 的 Speech-02 刚把 OpenAI 的 TTS 干趴下,登顶双榜,现在又来搞音乐。这节奏,明显是想从「AI 配音」一路杀到「AI 作曲」啊。再仔细想一下,人家 Speech-02 能搞定 32 种语言,
万万没想到,2025 开年惊喜是 MiniMax 给的,就是海螺 AI 背后的中国大模型 AI 创业公司。昨天刷信息流的时候,发现他们刚发布了两个新模型,一个是文本模型 MiniMax-Text-01,另一个是多模态模型 MiniMax-VL-01。统称为模型。今早我刷了下 X,发现 MiniMax-01 也被海外网友刷屏了。有网友提到这是继 Deepseek 之后的另一家来自中国的「OpenAI

AIGC 大模型能力提升 10 倍,8-80 FP8 TFLOPS,单 Core 带宽 256GB/s,Prefill 算力利用率达 72%,Decode 有效带宽利用率超 100%。
潞晨科技正式推出 Open-Sora 2.0—— 一款全新开源的 SOTA 视频生成模型,仅 20 万美元(224 张 GPU)成功训练商业级 11B 参数视频生成大模型。开发高性能的视频生成模型通常耗资高昂:Meta 的视频模型训练需要 6000 多张 GPU 卡片,投入数百万美元~~。在多项关键指标上,它与动辄百万美元训练成本的模型分庭抗礼,全面提升视频生成的可及性与可拓展性。今天,视频生成领

DeepSeek 这一波,真的是把各家云厂商都逼急了,你叫得出名字的,叫不出的,纷纷上线了 DeepSeek R1 模型。而且优惠力度非常大——半价、免费、送 Tokens 等,简直把曾经发起 API 价格战的 DeepSeek 官方都卷沉默了。我本来是一直在拍手叫好的,但是作为开发者,我实际用了一圈后,我沉默了。因为我发现不少云厂商,虽然免费,但 TPM(Tokens Per Mintute)给

在 AI“云转端”的关键节点,一场属于 AI 开发者的终极挑战正式开启!AI 不再只是存在于服务器与大模型之中,而是正在深度融入我们的日常设备。这场科技革命的浪潮中,蕴藏着无数尚未被发掘的创新可能。,正是一次聚焦“AI 端侧落地”的全面探索。诚邀开发者、团队、企业,基于骁龙平台,共创高效、实用、突破想象力的 AI 应用!
最左侧的红色条状是最新版本 2507 的成绩,比上一版本 Qwen3 强了一大截,而且和闭源的 Gemini-2.5 pro、o4-mini 比,在很多硬核能力上,比如 AIME25、LiveCodeBench、Arena-Hard 上,已经开始反超 Gemini-2.5 pro、o4-min 这些顶级闭源模型。但这波三连发真正厉害的地方,不只在于性能登顶,更在于它展现的格局:当一些海外巨头忙着建
它不仅压缩了信息处理的时间,更重要的是跳脱出已知内容的限制,通过推理思维框架,注入了更多维度的认知可能性(说不定我们就能从AI的思考中,碰撞出更多的创新点~)对于这类专业问题,此前很多回答都只是泛泛而谈,想要深入,要么花钱,要么花时间(没个一两天都下不来,效果还不一定好)。虽说现在的答案是否定的,但看着这样详细的步骤,让人不禁对未来有了更多的期待和向往~这样一来,既能保障推理的深度,又能一定程度兼

我这两天注意到,百度文心开始疯狂搞事情了,直接贴官网图——刚刚热乎的官宣,文心 4.5 即将发布,而且是开源。另外这是昨天的消息——得益于文心大模型的持续迭代和推理成本的持续降低,文心一言终于全面免费了。这搞事情的动作太密集了...接连宣布免费、开源背后,可以看到百度更加开放,另一方面,这也是百度的技术底气,近两年来文心大模型能力进化一直在路上,让开发者和广大用户更低门槛地用上大模型的能力。但我发

然后在某个深夜,当你打开那个页面,看到那些被它整理好的、关于你的文字时,你会突然意识到:原来我是这样的人。又或者,你最近常来,问题问得也复杂,它就知道你不是路人,是个“老用户”,说话自然会更配合一点。但当你真的打开那个 Memory 页面,看到它给你写的那些文字时,那种感觉,是复杂的。如果说第一层的「会话元数据」只是 ChatGPT 在观察你,那第二层的「用户记忆」,就是它开始真正“记住你”的地方







