logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【AI工具】dify智能体-Kimi-K2+Mermaid ,一键生成系统架构图

在现代软件工程的复杂环境中,清晰、准确的系统架构图是沟通、设计和维护的基石。然而,对于许多架构设计人员和开发者而言,手动绘制和维护这些图表是一项耗时且容易出错的任务。为了解决这一痛点,一种结合了先进AI模型、低代码平台和文本化图表工具的全新解决方案应运而生。本报告将深入探讨如何利用Dify智能体平台,集成强大的Kimi-K2-Instruct大语言模型和灵活的Mermaid图表生成器,构建一个能够

文章图片
#人工智能#系统架构
【AI学习】谷歌:AI智能体入门白皮书

用最通俗的话来说,AI智能体可以定义为模型、工具、编排层和运行时服务的组合体——它通过让大语言模型(LM)在循环中持续工作,最终实现既定目标。这四个要素共同构成了任何自主系统的核心架构:模型(“大脑”):作为智能体核心推理引擎的大语言模型或基础模型,负责处理信息、评估选项并做出决策。模型的类型(通用型、微调型或多模态型)决定了智能体的“认知能力”水平。一个Agentic AI系统,本质上是大语言模

文章图片
#人工智能#学习
【AI学习】WAIC2025大会少量记录

模型成本不仅包括训练成本,还应考虑设计成本。通过优化模型设计,可以在一定程度上平衡算力差异带来的影响。

文章图片
#学习
【论文阅读】WebWalker: Benchmarking LLMs in Web Traversal

【导读】传统搜索只能“扫射”网页表层,而复杂答案往往藏在多级按钮之后。阿里通义实验室最新论文提出WebWalkerQA,用680个双语问答,首次系统评测大模型“翻网页找答案”的能力。作者还设计多智能体框架WebWalker,让探索者负责逐层点击,评论者实时记忆与判断,像人类一样深度遍历。实验显示,即使GPT-4o,准确率也不到40%,证明深度信息仍是RAG盲区。把WebWalker插入传统RAG后

文章图片
#论文阅读#自然语言处理#RAG
【论文阅读】通义实验室,VACE: All-in-One Video Creation and Editing

VACE 是视频生成领域的一项里程碑式工作,首次实现了多任务统一的视频创作与编辑框架。通过 VCU 输入范式、Concept Decoupling 与 Context Adapter 等创新设计,VACE 打破了“单任务单模型”的局限,为视频 AIGC 提供了更高效、更灵活的解决方案。

文章图片
#论文阅读#计算机视觉#人工智能 +1
【论文阅读】One-Minute Video Generation with Test-Time Training

本文介绍了一种名为“Test-Time Training(TTT)”的方法,用于生成一分钟长的视频。尽管当前的Transformer架构在视觉和物理逼真度方面取得了显著进展,但它们仍然只能生成较短的单场景视频片段,仍然很难制作一分钟的视频,难以生成复杂故事。这是因为Transformer的自注意力层在处理长上下文时效率低下,其计算成本随着上下文长度呈二次方增长。为了解决这一挑战,作者提出了一种新的

文章图片
#论文阅读#音视频
【论文阅读】A Survey on Sparse Autoencoders: Interpreting the Internal Mechanisms of Large Language Models

论文的核心研究动机源于当前人工智能领域,尤其是大型语言模型(LLMs)在取得显著进展的同时,其内部机制的不可解释性带来的严峻挑战。近年来,以GPT-4、Claude-3.5等为代表的LLMs在文本生成、问答系统、逻辑推理、代码编写等任务中展现出接近甚至超越人类的能力。然而,这种强大性能的背后是极为复杂的神经网络架构(如Transformer)和海量的参数量(通常超过千亿级别),导致模型决策过程高度

文章图片
#论文阅读#语言模型#人工智能
【论文学习】Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning

随着大语言模型(LLMs)的快速发展,出现了多种架构和微调变体。为了充分利用这些模型的互补优势,LLM路由器应运而生,用于动态调度用户查询到最适合的模型以提高回答质量和效率。然而,现有的LLM路由器通常只进行单轮的一对一映射,即将每个查询分配给单个模型,这限制了它们处理复杂任务的能力,因为复杂任务往往需要多个模型的协同交互来发挥它们的互补优势。因此,如何协调多个LLM在多轮路由和聚合过程中共同解决

文章图片
#学习
【AI工具】dify智能体-Kimi-K2+Mermaid ,一键生成系统架构图

在现代软件工程的复杂环境中,清晰、准确的系统架构图是沟通、设计和维护的基石。然而,对于许多架构设计人员和开发者而言,手动绘制和维护这些图表是一项耗时且容易出错的任务。为了解决这一痛点,一种结合了先进AI模型、低代码平台和文本化图表工具的全新解决方案应运而生。本报告将深入探讨如何利用Dify智能体平台,集成强大的Kimi-K2-Instruct大语言模型和灵活的Mermaid图表生成器,构建一个能够

文章图片
#人工智能#系统架构
【论文学习】Model Context Protocol (MCP): Landscape, Security Threats, and Future Research Directions

来自华中科技大学的研究者发了一篇MCP的综述论文。这篇文章,可以作为学习MCP的学习资料,论文全面分析了模型上下文协议(Model Context Protocol, MCP)的生态系统,探讨了其架构、核心组件、工作流程、服务器生命周期,以及在创建、运行和更新阶段的安全风险,并提出了未来研究方向和建议。

文章图片
#学习#人工智能
    共 85 条
  • 1
  • 2
  • 3
  • 9
  • 请选择