thesky123456 个人主页

@thesky123456

thesky123456

2022-10-24 20:26:48 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

国产海光DCU及超算平台深度解析

尽管面临生态完善度与国际技术差距的挑战，其持续迭代的产品性能、与DeepSeek等企业的深度合作，以及国家“东数西算”战略的推动，将加速国产DCU在AI、科学计算等领域的全面替代进程。• 智算中心建设：在国家级超算中心中，海光DCU集群已支持千亿参数大模型训练，单集群算力规模达100PFLOPS（FP16），训练效率达到英伟达H100集群的65%。• 采用7nm+工艺，显存容量提升至512GB，带

#人工智能 #大数据

llama factory怎么命令行推理图片

{"role": "assistant", "content": "这是由电阻R1、电容C2和运放U3组成的低通滤波电路..."}• Windows系统需使用双反斜杠：`"images": ["data\\mllm_demo_data\\1.jpg"]`"file_name": "circuit_sum_data.json",// 实际数据文件名。{"role": "user", "content

#深度学习

《ViDoRAG: Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents》

本文提出ViDoRAG框架，针对视觉丰富文档（VRD）的大规模检索与问答难题进行创新突破。通过多模态混合检索（融合文本OCR与视觉特征）和动态自适应召回策略（GMM优化Top-K），显著提升跨文档检索效率（平均检索页数减少32%）。创新设计多智能体迭代推理机制（Seeker-Inspector-Answerer协同），在自建评估基准ViDoSeek上实现10%的性能跃升，尤其在布局类问题表现突出（

#人工智能 #机器学习 #深度学习

《OMNIEAR: BENCHMARKING AGENT REASONING IN EMBODIED TASKS》

论文《OMNIEAR: BENCHMARKING AGENT REASONING IN EMBODIED TASKS》提出首个评估具身智能体物理推理能力的基准。针对现有基准在连续物理属性建模、动态工具获取和隐式协作识别方面的不足，该研究构建了包含1,500个场景的三层次评估体系，涵盖单代理基础指令到多代理复合协作任务。实验发现：大模型在隐式推理任务中性能骤降29%，72B参数后出现性能饱和；多代理

#人工智能 #算法

四个典型框架对比

选择多智能体框架就像为项目挑选合适的“团队协作模式”。AutoGen 像是一个专业的软件开发团队，擅长编码和自动化。像是一位强大的架构师，能设计和管理极其复杂的工作流。CrewAI 像一个高效的轻量级任务小组，追求快速响应和简单配置。MetaGPT 则是一个虚拟的软件公司，能模拟从产品到测试的完整流程。希望这些信息能帮助你做出更好的选择

#深度学习 #大数据 #人工智能

一个好的智能体框架应该是什么样子

优秀多智能体协同框架应具备八大核心特征：模块化分工、高效通信机制、协同控制流、知识共享系统、冲突解决机制、自我改进能力、人机协同接口和可观测性设计。理想框架应像专业团队一样运作，支持动态角色分配（如产品经理、开发、测试等智能体），采用标准化通信协议，并具备状态同步和记忆管理能力。关键评估维度包括协同效率、方案质量、系统鲁棒性和可扩展性。不同框架各有侧重：AutoGen适合商业应用，CAMEL擅长复

#人工智能 #网络 #microsoft

Multi-Head RAG: Solving Multi-Aspect Problems with LLMs

《Multi-HeadRAG：基于多头注意力的大模型多维度检索增强生成方法》提出创新性解决方案，突破传统RAG在复杂查询中的性能瓶颈。研究揭示传统方法因单向量表征导致多维度语义丢失（如跨领域查询召回率不足40%），而MRAG通过提取Transformer多头注意力输出，零成本生成多组嵌入向量，分别捕获不同语义维度。实验表明，该方法在合成/工业数据集上实现20%召回率提升，且保持存储效率（总维度不变

#人工智能

《MRAMG-Bench: A Comprehensive Benchmark for Advancing Multimodal Retrieval-Augmented Multimodal Gene

《MRAMG-Bench：多模态检索增强生成综合基准》解析该论文创新性地提出了多模态检索增强多模态生成(MRAMG)任务，突破传统RAG仅输出文本的局限，要求系统生成图文交织的答案。研究团队构建了包含4,800QA对的跨领域评测基准MRAMG-Bench，涵盖网页、学术、生活三大场景，首创支持动态图像插入位置评估的体系。实验对比11个模型发现：GPT-4o在LLM-Based方法中表现最优(平均

#人工智能 #深度学习 #大数据

ReMA——基于多智能体强化学习的大语言模型元思考能力培养框架

《ReMA：基于多智能体强化学习的LLM元思考训练框架》摘要 OPPO AI团队提出的ReMA框架创新性地通过双智能体架构培养大语言模型的元思考能力。该框架将推理过程分解为高层策略制定与底层任务执行，采用分层强化学习实现协同优化。实验表明，ReMA在数学推理等任务上实现6.68%的平均提升，计算效率提升84.6%，并在跨领域任务中展现出卓越的泛化能力。该研究开源了包含模型权重、训练代码和16万条轨

#人工智能 #大数据 #深度学习

RAGFlow

RAGFlow是一款开源深度文档理解型RAG引擎，支持30+格式文档解析，具备智能分块、混合检索和可溯源问答功能。其核心技术包括表格识别（准确率超90%）、多路召回检索（召回率提升35%）和自动化工作流，支持GPT等主流大模型集成。采用分层微服务架构，适用于企业知识库、智能客服等场景，提供Docker一键部署方案，相比同类产品在复杂文档处理和答案溯源方面表现更优。

#人工智能 #深度学习 #大数据

共 15 条

请选择