logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DAMO(Data Analysis and Modeling Environment)

小型DAMO测试平台技术方案摘要(150字) 本方案构建多模态数据处理平台,整合VideoLLaMA3视频分析(支持DiffFP剪枝技术)与PyMuPDF/ABBYY文档解析双核心。视频模块实现2分钟MP4的帧级分析(RTX4090耗时3分钟),PDF模块提供表格提取与漏洞检测功能。通过Neo4j构建跨模态知识库,支持文本-视频内容一致性验证(余弦相似度比对)。系统采用Python+MoviePy

#人工智能
三大AI模型应用场景对比与优化指南

三个模型(GPT-4o、Claude、Gemini)在数据应用场景示例、AI大模型训练和知识管理两个核心场景的描述上具有共同点,均包含附则部分,明确了手册的生效日期和解释权归属,且结构清晰、逻辑连贯。然而,它们在场景数量和类型、内容结构、章节设置及详细程度上存在差异。Claude提供了最为全面和详细的内容,特别是增加了培训与实施计划章节;Gemini在数据收集策略和数据质量要求方面提供了更多实操性

文章图片
#人工智能
30,000+高质量样本的P2PInstruct数据集

P2P是基于大语言模型(LLM)的多智能体框架,旨在实现从学术论文到HTML格式学术海报的自动化生成。其核心创新在于通过三个专业化智能体(视觉元素处理、内容生成、海报组装)的分工协作,结合检查器模块的迭代优化机制,生成符合学术规范的高质量海报。项目构建了包含30,000+高质量样本的P2PInstruct数据集,并发布了包含121对论文-海报组合的P2PEval基准测试,通过双评估体系(通用+细粒

文章图片
#大数据#人工智能#spark +1
API调用 + 本地部署深度融合

摘要: 本文提出API调用与本地部署深度融合的技术方案,实现本地化知识库构建与多模态处理。方案采用混合架构设计,云端API满足高并发需求,本地模型(Ollama+DeepSeekR1)保障涉密数据安全,结合FastAPI封装服务与AnythingLLM构建知识库。关键技术包括文档解析优化(支持PDF/表格/扫描件)、流式输出及安全增强措施(AES加密、JWT鉴权)。实测显示本地部署响应时延可控(R

#开源#人工智能#python
检索增强生成(RAG)如何革新计算机视觉?这篇综述给出了答案!

这篇论文全面回顾了计算机视觉领域中检索增强生成(RAG)技术的现状,探讨了其在视觉理解、视觉生成和具身视觉中的应用。通过整合外部知识,RAG技术显著提高了模型在图像识别、视频分类、图像生成和3D生成等任务中的性能。尽管RAG技术在计算机视觉中仍面临检索效率、模态对齐和计算成本等挑战,但未来的研究方向包括实时检索优化、跨模态融合和RAG在具身AI、3D内容生成和机器人领域的应用,有望进一步推动这一领

文章图片
#python#科技
《揭秘:多代理LLM系统为何频频失败?》​

这篇论文《Why Do Multi-Agent LLM Systems Fail?》对多代理大型语言模型(LLM)系统中的失败模式进行了开创性的研究。作者通过系统地分析多个流行的多代理框架,识别出14种独特的失败模式,并提出了一个适用于各种多代理框架的全面分类法(MASFT)。这项工作不仅为理解多代理系统的失败提供了结构化的框架,还为未来的研究指明了方向。论文中提出的MASFT分类法通过专家注释和

文章图片
#人工智能#深度学习
关于秘塔搜索的deepresearch方案

这个模式有意思,先想后搜,先搜后广。可以让模型先提出思考框架与路径,再进一步进行资料的整合与分析。采用“小模型+大模型”协同架构,将需要深度推理的框架思考、步骤拆解的部分,交给业内擅长推理的DeepSeek R1来完成;与此同时,为了提高响应速度,将应该快、可以快的信息搜索、资料整合部分,用秘塔自研的模型来完成。在这个框架下,秘塔可以在2-3分钟完成数百个网页的搜索与分析。

#python
通义万相视频生成重磅升级,成功登顶VBench,运镜、质感直达专业级

Prompt: 一位摩托车骑手在狭窄的城市街道上以极快的速度疾驰,避开了附近建筑物发生的大爆炸,火焰猛烈地咆哮着,投射出明亮的橙色光芒,碎片和金属碎片在空中飞舞,加剧了现场的混乱。然而,骑手依然不屈不挠,准确无误地在混乱中穿梭,极富电影感,超精细细节,身临其境,3D,动作连贯。在具体实现中,通过将视频拆分为若干块(Chunk)并缓存中间特征,代替了直接对长视频的 E2E 解码过程,使显卡的使用仅与

#python
如何在 Trea 中更新 MCP 服务配置

在Trea平台更新MCP服务配置的步骤包括:登录管理控制台并定位目标服务,修改环境变量等参数后保存发布。需验证配置是否生效,必要时可回滚至旧版本。操作可能因平台版本不同而略有差异,建议参考官方文档。注意事项包括权限要求、兼容性检查及配置备份等。

#人工智能#开发语言#数据挖掘
本地部署DeepSeekR1:完整指南

《DeepSeekR1本地部署指南》提供两种主流部署方式:Ollama(适合开发者)和LMStudio(适合普通用户)。硬件要求最低需4核CPU、8GB内存和20GB存储,推荐配置为8核CPU、32GB内存及高性能显卡。教程涵盖从软件安装、模型下载到API服务配置的全流程,并给出不同参数模型的适用场景建议(1.5B基础版至32B专业版)。重点包括环境配置、性能优化技巧及常见问题解决方案,支持Win

#大数据
    共 32 条
  • 1
  • 2
  • 3
  • 4
  • 请选择