CSDN资讯个人主页

@csdnnews

CSDN资讯

2022-06-08 23:22:45 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

百万 Token 也能无损压缩？C3 模型用“级联压缩”重新定义长上下文挑战

实验表明，在 20 倍压缩比（文本 token 数量是潜在 token 数量的 20 倍）下，C3 实现了 98% 的解码准确率，而 DeepSeek OCR 大约为60%。具体来说，一个小型 LLM 作为第一级，通过将长上下文压缩成一组潜在 token（例如，长度为 32 或 64），实现高比例的文本 token 到潜在 token 的压缩。1. 超长上下文处理：C3 可作为现有 LLM 的"前

赢取千元奖品！TextIn大模型加速器+火山引擎，多语言文档处理挑战营正式启动！

本次挑战营邀请广大开发者，基于合合信息旗下Textln打造，火山引擎提供平台支撑的文本智能领域AI创新应用，结合真实业务或创意设想进行技术实践与内容创作，共同探索TextIn“大模型加速器”+Coze/Hi Agent的实际应用场景与业务价值。近期，由合合信息 TextIn 打造、火山引擎提供平台支撑的“大模型加速器”升级版正式发布，双方共同打造文本智能领域的AI创新应用，为企业与开发者提供一站式

#火山引擎

绿盟科技打出组合拳：为大模型构建全栈自身安全屏障

进入2025年下半年，绿盟科技在大模型安全能力构建方面跑出了惊人的加速度，此次众多新的发布，进一步夯实了其“研究-产品-运营”全栈的大模型安全能力。而伴随着大模型及其应用的进一步走深向实，相信大模型安全的价值与地位将更加凸显，而绿盟科技已经为此做好准备。

#人工智能 #安全

AI编程革命：对话大厂技术负责人孟健，揭秘开发者如何抢占未来先机

我一直专注于前沿技术的探索和实践，近年来深度投入 AI 编程领域的研究和应用，主理“孟健 AI 编程”公众号，全网 3 万+粉丝。我是《DeepSeek 极简入门与应用》一书的作者，这本书销量已经突破 70 万册，同时，我在 GitHub 上开源了 10 多个 AI Coding 相关项目，获得上千 star。首先要拥抱变化，不要抗拒 AI 工具。AI 将能够理解更复杂的业务逻辑，生成更高质量的代

#人工智能

以向善价值观构建数字信任，数美2025 AI风控大会重磅发布“AI风控新范式”

12月11日，由数美科技主办的“数美 2025 AI 风控大会”在北京举行。会上，数美科技正式发布了“ AI 风控新范式”及覆盖全场景的 AI 风控产品矩阵，并联合权威机构发布行业白皮书，为 AI 时代的数字治理提供了从顶层设计到实战落地的全新解法。

#人工智能 #大数据 #安全

CSDN创始人蒋涛：“AI+开源”重塑开发范式，构建者涌现正当时

越来越多的‘码盲’通过AI赋能，将成为拥有开发能力的新程序员，这就是新的‘构建者’，未来我们必将迎来‘构建者’的大时代。”他进一步指出，“在过去的5到10年间，中国已从开源世界的追随者，稳步迈进核心圈层，成为仅次于美国的重要力量。“今天的智能软件研发，不仅需要坚实的AI底座能力，还离不开企业自身的知识库沉淀、配套的工具链建设、组织架构升级以及完善的安全管理体系——这一切，都与过去的开发模式有着根本

#人工智能 #开源

360开源全网首个RL-LoRA训练方案，开启AI高效进化新时代

GRPO的训练能够简洁有效的提升大模型的推理能力，同时保持更优的泛化能力。面对行业共性难题，近日，在360数字安全集团冰刃实验室主导下，打造出“轻量化、高性能”的AI训练方案：RL-LoRA，在保持模型泛化能力的前提下，体积仅为原始全参数模型的1%-5%，实现强化学习训练技术引领性突破。，需要持续对训练效率优化提升。实际测试中，对于LoRA_rank=32的0.5B模型，采用RL-LoRA训练方法

#人工智能

突发！Anthropic闪电断供Windsurf，Claude API五日内全面切断!

那么，编程模型哪家强？而在 Claude 3.7 出来之前，是 Claude 3.5——作为业内的 AI 模型龙头厂商，Anthropic 死死咬着编程和 Agent 这两条赛道，无论是 OpenAI、谷歌、DeepSeek 还是马斯克 Grok，都很难在编程完全赢过 Claude。就在不久前，多家媒体报道称 OpenAI 已同意斥资约 30 亿美元收购 Windsurf，这笔交易若最终敲定，将成

#人工智能

蚂蚁开源在外滩大会发布2025全球大模型开源生态全景图，揭示AI开发三大趋势

9 月 13 日，在 2025 Inclusion·外滩大会AI开源见解论坛上，蚂蚁开源联合Inclusion AI 发布了全新的《全球大模型开源开发生态全景与趋势告》，全面揭示了人工智能开源领域的发展现状和未来趋势，还纳入了百余天内开源社区的新动向，为行业发展提供重要参考。

#开源 #人工智能

Agent 也有 Scaling Law！智谱发布首个“边想边干”的 Agent

AutoGLM 沉思的技术演进路径进行了披露，包括：在 GLM-4-Air 基座模型的基础上，训练出推理模型 GLM-Z1-Air，基于 Z1 模型，结合工具使用和完成长程推理能力，训练出沉思模型，来作为 AutoGLM 沉思的大脑。AutoGLM 沉思背后的模型，是智谱全新推出的 Agent 大脑——沉思模型，即通过强化学习，让模型学会自我批评、反思、甚至沉思，并通过更长的深度思考时间换取更优的

#人工智能

共 18387 条

1
2
3
1839

请选择