logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

6G 与多模态技术融合:驱动数字经济新变革

6G 与多模态技术融合:驱动数字经济新变革

#人工智能
地瓜机器人获1亿美元融资,加速具身智能生态

地瓜机器人完成1亿美元A轮融资,由高瓴创投领投。该公司致力于构建开放的机器人基础设施平台,产品覆盖芯片、算法及软件,算力范围5-500TOPS,适配多种机器人场景。核心产品包括RDKS100开发套件和旭日系列芯片,后者已出货500万片。公司已赋能200多家创客,孵化近百种机器人品类,开发者生态覆盖20多国,并与200多所高校合作培养人才。

#人工智能
AIAppLab:解锁大模型应用最后一公里

火山方舟AIAppLab开源仓库为大模型应用落地提供全流程解决方案,包含Arkitect高代码SDK工具集和Demohouse原型应用库。Arkitect支持多模型协同、插件生态和开发流程优化;Demohouse提供教育、电商等垂直领域场景化实践案例。该技术架构通过"模型-工具-场景"三位一体设计,解决大模型应用开发中的复杂性问题,显著降低开发门槛,助力企业快速实现AI转型。

文章图片
#python#人工智能#sqlite
地瓜机器人获1亿美元融资,加速具身智能生态

地瓜机器人完成1亿美元A轮融资,由高瓴创投领投。该公司致力于构建开放的机器人基础设施平台,产品覆盖芯片、算法及软件,算力范围5-500TOPS,适配多种机器人场景。核心产品包括RDKS100开发套件和旭日系列芯片,后者已出货500万片。公司已赋能200多家创客,孵化近百种机器人品类,开发者生态覆盖20多国,并与200多所高校合作培养人才。

#人工智能
检索增强生成(RAG)如何革新计算机视觉?这篇综述给出了答案!

这篇论文全面回顾了计算机视觉领域中检索增强生成(RAG)技术的现状,探讨了其在视觉理解、视觉生成和具身视觉中的应用。通过整合外部知识,RAG技术显著提高了模型在图像识别、视频分类、图像生成和3D生成等任务中的性能。尽管RAG技术在计算机视觉中仍面临检索效率、模态对齐和计算成本等挑战,但未来的研究方向包括实时检索优化、跨模态融合和RAG在具身AI、3D内容生成和机器人领域的应用,有望进一步推动这一领

文章图片
#python#科技
一些机器学习的学习资源推荐:

你可以根据自己的学习需求、基础和偏好,选择适合自己的学习资源。在学习过程中,多实践、多动手,结合实际项目进行学习,能够更好地掌握机器学习的知识和技能。

文章图片
#机器学习#学习#人工智能
DAMO(Data Analysis and Modeling Environment)

小型DAMO测试平台技术方案摘要(150字) 本方案构建多模态数据处理平台,整合VideoLLaMA3视频分析(支持DiffFP剪枝技术)与PyMuPDF/ABBYY文档解析双核心。视频模块实现2分钟MP4的帧级分析(RTX4090耗时3分钟),PDF模块提供表格提取与漏洞检测功能。通过Neo4j构建跨模态知识库,支持文本-视频内容一致性验证(余弦相似度比对)。系统采用Python+MoviePy

#人工智能
三大AI模型应用场景对比与优化指南

三个模型(GPT-4o、Claude、Gemini)在数据应用场景示例、AI大模型训练和知识管理两个核心场景的描述上具有共同点,均包含附则部分,明确了手册的生效日期和解释权归属,且结构清晰、逻辑连贯。然而,它们在场景数量和类型、内容结构、章节设置及详细程度上存在差异。Claude提供了最为全面和详细的内容,特别是增加了培训与实施计划章节;Gemini在数据收集策略和数据质量要求方面提供了更多实操性

文章图片
#人工智能
30,000+高质量样本的P2PInstruct数据集

P2P是基于大语言模型(LLM)的多智能体框架,旨在实现从学术论文到HTML格式学术海报的自动化生成。其核心创新在于通过三个专业化智能体(视觉元素处理、内容生成、海报组装)的分工协作,结合检查器模块的迭代优化机制,生成符合学术规范的高质量海报。项目构建了包含30,000+高质量样本的P2PInstruct数据集,并发布了包含121对论文-海报组合的P2PEval基准测试,通过双评估体系(通用+细粒

文章图片
#大数据#人工智能#spark +1
API调用 + 本地部署深度融合

摘要: 本文提出API调用与本地部署深度融合的技术方案,实现本地化知识库构建与多模态处理。方案采用混合架构设计,云端API满足高并发需求,本地模型(Ollama+DeepSeekR1)保障涉密数据安全,结合FastAPI封装服务与AnythingLLM构建知识库。关键技术包括文档解析优化(支持PDF/表格/扫描件)、流式输出及安全增强措施(AES加密、JWT鉴权)。实测显示本地部署响应时延可控(R

#开源#人工智能#python
    共 34 条
  • 1
  • 2
  • 3
  • 4
  • 请选择