logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

百万 Token 也能无损压缩?C3 模型用“级联压缩”重新定义长上下文挑战

实验表明,在 20 倍压缩比(文本 token 数量是潜在 token 数量的 20 倍)下,C3 实现了 98% 的解码准确率,而 DeepSeek OCR 大约为60%。具体来说,一个小型 LLM 作为第一级,通过将长上下文压缩成一组潜在 token(例如,长度为 32 或 64),实现高比例的文本 token 到潜在 token 的压缩。1. 超长上下文处理:C3 可作为现有 LLM 的"前

赢取千元奖品!TextIn大模型加速器+火山引擎,多语言文档处理挑战营正式启动!

本次挑战营邀请广大开发者,基于合合信息旗下Textln打造,火山引擎提供平台支撑的文本智能领域AI创新应用,结合真实业务或创意设想进行技术实践与内容创作,共同探索TextIn“大模型加速器”+Coze/Hi Agent的实际应用场景与业务价值。近期,由合合信息 TextIn 打造、火山引擎提供平台支撑的“大模型加速器”升级版正式发布,双方共同打造文本智能领域的AI创新应用,为企业与开发者提供一站式

文章图片
#火山引擎
绿盟科技打出组合拳:为大模型构建全栈自身安全屏障

进入2025年下半年,绿盟科技在大模型安全能力构建方面跑出了惊人的加速度,此次众多新的发布,进一步夯实了其“研究-产品-运营”全栈的大模型安全能力。而伴随着大模型及其应用的进一步走深向实,相信大模型安全的价值与地位将更加凸显,而绿盟科技已经为此做好准备。

文章图片
#人工智能#安全
AI编程革命:对话大厂技术负责人孟健,揭秘开发者如何抢占未来先机

我一直专注于前沿技术的探索和实践,近年来深度投入 AI 编程领域的研究和应用,主理“孟健 AI 编程”公众号,全网 3 万+粉丝。我是《DeepSeek 极简入门与应用》一书的作者,这本书销量已经突破 70 万册,同时,我在 GitHub 上开源了 10 多个 AI Coding 相关项目,获得上千 star。首先要拥抱变化,不要抗拒 AI 工具。AI 将能够理解更复杂的业务逻辑,生成更高质量的代

文章图片
#人工智能
以向善价值观构建数字信任,数美2025 AI风控大会重磅发布“AI风控新范式”

12月11日,由数美科技主办的“数美 2025 AI 风控大会”在北京举行。会上,数美科技正式发布了“ AI 风控新范式”及覆盖全场景的 AI 风控产品矩阵,并联合权威机构发布行业白皮书,为 AI 时代的数字治理提供了从顶层设计到实战落地的全新解法 。

文章图片
#人工智能#大数据#安全
CSDN创始人蒋涛:“AI+开源”重塑开发范式,构建者涌现正当时

越来越多的‘码盲’通过AI赋能,将成为拥有开发能力的新程序员,这就是新的‘构建者’,未来我们必将迎来‘构建者’的大时代。”他进一步指出,“在过去的5到10年间,中国已从开源世界的追随者,稳步迈进核心圈层,成为仅次于美国的重要力量。“今天的智能软件研发,不仅需要坚实的AI底座能力,还离不开企业自身的知识库沉淀、配套的工具链建设、组织架构升级以及完善的安全管理体系——这一切,都与过去的开发模式有着根本

#人工智能#开源
360开源全网首个RL-LoRA训练方案,开启AI高效进化新时代

GRPO的训练能够简洁有效的提升大模型的推理能力,同时保持更优的泛化能力。面对行业共性难题,近日,在360数字安全集团冰刃实验室主导下,打造出“轻量化、高性能”的AI训练方案:RL-LoRA,在保持模型泛化能力的前提下,体积仅为原始全参数模型的1%-5%,实现强化学习训练技术引领性突破。,需要持续对训练效率优化提升。实际测试中,对于LoRA_rank=32的0.5B模型,采用RL-LoRA训练方法

文章图片
#人工智能
突发!Anthropic闪电断供Windsurf,Claude API五日内全面切断!

那么,编程模型哪家强?而在 Claude 3.7 出来之前,是 Claude 3.5——作为业内的 AI 模型龙头厂商,Anthropic 死死咬着编程和 Agent 这两条赛道,无论是 OpenAI、谷歌、DeepSeek 还是马斯克 Grok,都很难在编程完全赢过 Claude。就在不久前,多家媒体报道称 OpenAI 已同意斥资约 30 亿美元收购 Windsurf,这笔交易若最终敲定,将成

#人工智能
蚂蚁开源在外滩大会发布2025全球大模型开源生态全景图,揭示AI开发三大趋势

9 月 13 日,在 2025 Inclusion·外滩大会AI开源见解论坛上,蚂蚁开源联合Inclusion AI 发布了全新的《全球大模型开源开发生态全景与趋势告》,全面揭示了人工智能开源领域的发展现状和未来趋势,还纳入了百余天内开源社区的新动向,为行业发展提供重要参考。

文章图片
#开源#人工智能
Agent 也有 Scaling Law!智谱发布首个“边想边干”的 Agent

AutoGLM 沉思的技术演进路径进行了披露,包括:在 GLM-4-Air 基座模型的基础上,训练出推理模型 GLM-Z1-Air,基于 Z1 模型,结合工具使用和完成长程推理能力,训练出沉思模型,来作为 AutoGLM 沉思的大脑。AutoGLM 沉思背后的模型,是智谱全新推出的 Agent 大脑——沉思模型,即通过强化学习,让模型学会自我批评、反思、甚至沉思,并通过更长的深度思考时间换取更优的

#人工智能
    共 18387 条
  • 1
  • 2
  • 3
  • 1839
  • 请选择