登录社区云,与社区用户共同成长
邀请您加入社区
模型圈一直都很热闹,每月都有各种新的模型出来。最近一个月,国产大模型不断推出新模型,Step 3.7 Flash、MiniMax M3、GLM-5.2、Kimi K2.7 Code几乎都是前后脚发布。我仔细研究了一下这几个新的模型,它们的路子还有点不一样,Step 3.7 Flash主攻性价比和低延迟,MiniMax M3死磕超长上下文和Agentic Workflow,GLM-5.2走通用开源路
【摘要】AI技术正在颠覆安全测试领域,Gemini等大模型可自动生成PoC脚本,极大提升漏洞验证效率。文章展示了如何通过自然语言指令让AI快速生成基础PoC代码(如Log4j2漏洞脚本),并支持动态调优绕过WAF等复杂需求。案例证明AI能解决SQL盲注、老旧CVE修复等痛点,但需警惕"幻觉代码"和合规风险。虽然AI能自动化重复劳动,安全工程师仍需保持专业判断。未来AI与漏洞库的
使用codex一段时间后,最大的感受不是“它又多了几个功能”,而是低估了 Codex。它不只是回答问题,更重要的是可以在授权后直接参与工作流程。接下来将从几个方面分享codex的使用。
DSpark 通过半自回归架构和置信度调度验证两项互补机制,解决了推测解码在真实生产环境中的两大核心瓶颈。在 DeepSeek 线上服务中,单用户生成速度提升60%-85%局限:可预测性极低、接受率偏低的复杂查询,前置草稿算力无法回收[reference:215]。未来方向:草稿模型内部引入难度感知的早退出机制DSpark 的意义不仅是技术突破,更在于将推测解码从学术概念变成生产标配——这可能是
OpenCode是一款免费的AI编程工具,适合零成本体验AI辅助开发。相比Claude Code和Codex,虽然能力稍弱,但安装简单且无需特殊网络配置。它支持项目开发、文件分析、文档编写等功能,能自主操作文件并自我调试。使用时需连接API并选择免费模型,提供初始化、附件添加、模式切换等实用指令,还能查看历史对话和拓展功能。详情可参考官方文档。
文章探讨了产品经理在大模型时代的未来走向,强调了掌握 AI 产品完整生命周期能力的重要性。文章深入解析了大模型的本质、Prompt Engineering、Token 计费、RAG 检索增强生成、Fine-tuning 微调、Agent 智能体、Function Calling 函数调用等关键概念,并提供了实用的产品设计和优化建议。文章还涵盖了多轮对话与上下文管理、流式输出、MCP 模型上下文协议
本文深入剖析了AI Agent项目从demo到工程落地的核心挑战与解决方案。作者指出,Agent成功的关键并非依赖更强大的模型,而是要搭建稳固的Token、Skill、RAG、MCP、SDD、Harness六层约束链路。文章详细阐述了每一层的作用与常见问题,并提供了具体的工程实践建议,强调上下文管理、操作规范沉淀、知识证据检索、工具接入标准化以及执行过程监控的重要性,帮助开发者将不确定的模型封装成
对于任何输入,大语言模型都会给出相应的输出,这些输入都可以成为提示词,通常,提示词由指令和输入数据组成,指令是任务,输入数据是完成的要求,其中指令应该明确,用词不能模棱两可,并可以提供清晰、详细的上下文内容,提供的内容越精确,模型的生成效果也会越好。对于复杂的任务,通过增加背景提示、让大模型扮演角色身份,给定示例,以及输出要求 ,都可以提高输出的效果。其中,背景提示可以是事件的背景,如我正在写一份
该模型旨在解决化学图像理解与文本分析之间的不兼容问题,通过结合视觉 Transformer (ViT)、多层感知机 (MLP) 和大型语言模型 (LLM) 的优势,实现了对化学图像和文本的全面推理。可以看到模型针对图像准确描述了图像的内容是黄色的液氮罐,接着我们可以继续问它一个问题,比如我们输入「液氮的化学分子式是什么」。平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 A100的算力和
本文基于cool-pi CM5 32G内存版本验证,系统为coolpi官方ubuntu20.04.
大型语言模型(LLM)例如最近开发的 ChatGPT,可以撰写文件、创建可执行代码,并回答问题,常常具备类似人类的能力。随着这些系统越来越普遍,存在着它们可能被用于恶意目的的风险。这些风险包括利用社交媒体平台上的自动化机器人进行社会工程和选举操纵活动,制造假新闻和网络内容,以及使用 AI 系统在学术写作和编程任务中作弊。此外,网络上合成数据的增多使得未来数据集创建工作变得复杂,因为合成数据通常不如
晓天衡宇评测社区持续关注大模型的发展动态,近期针对国内外主流大语言模型进行了全面评测。榜单从智能体、代码、通用、推理四个维度,并基于20+主流评测基准,对国内外主流大语言模型进行了全面评测,现公布。本文基于Top 10评测结果进行解读,完整26个模型的全量排名和维度得分,欢迎访问晓天衡宇评测社区进行查看。欢迎点击👉🏻查看完整榜单。
本文详细解析了Transformer自注意力机制的核心原理。通过Q/K/V矩阵计算token间相似度,本质是语义嵌入训练使语义相似的文本对应方向相近的向量,点积运算量化了这种相似性。W_Q、W_K、W_V权重矩阵在训练时随机初始化并通过反向传播优化,推理时直接使用。文章还解释了分词、Embedding和注意力计算的整体流程,帮助读者理解自注意力机制如何捕获全局上下文信息。
本文探讨了大语言模型(LLM)服务面临的主要挑战及优化方案。LLM推理包含预处理和解码两个阶段,存在稀疏性、内存带宽限制、低效调度等问题。针对这些挑战,文章提出了多项优化技术:1)KV缓存管理(PageAttention、Raddix树、压缩注意力);2)查询感知稀疏注意力(QUEST);3)推测解码;4)权重调度(Flexgen);5)系统级优化(FastServe)。此外还介绍了量化、注意力机
25年1月来自康奈尔大学、亚利桑那州立大学、加州伯克利分校、德州奥斯汀分校和耶鲁大学的论文“Visual Large Language Models for Generalized and Specialized Applications”。视觉语言模型 (VLM) 已成为学习视觉和语言统一嵌入空间的有力工具。受大语言模型的启发,视觉-语言大模型 (VLLM) 在构建通用 VLM 方面受到越来越多
具有约束意识的可视化编程在反应式和主动式机器人故障检测中的应用
在上一篇中,已经用 LangChain 创建了一个简单的聊天模型,本篇将在该基础上,学习如何使用LangChain的提示词模板,并用LCEL将提示词模板和聊天模型链接起来,从而让聊天模型的返回结果更符合人的需要。LangChain允许使用提示词模板为聊天机器人设计模块化的prompt,提示词模板可以看作是语言模型生成提示词的预定义配方。假设想构建一个聊天机器人,回答有关患者评论的问题,提示词模板可
语言模型
——语言模型
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net