logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型LoRA微调笔记

本文简要介绍了微调过程的关键环节。研究使用魔搭社区提供的免费GPU资源进行模型训练,充分利用了该平台的计算资源。同时,详细说明了训练数据的来源和应用方式,展现了完整的数据使用流程。这些技术要素共同构成了模型微调的基础条件,为后续优化工作提供了必要支持。通过合理配置这些资源,确保了微调过程的顺利进行。

#人工智能
机械手简介

作者:李淼robot链接:https://www.zhihu.com/question/37352068/answer/75574944来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。简单的说,人手是怎么抓取的,到目前为止,我们知道的太有限,还完全不清楚,可以参考这篇文章 “Castiello, U. (2005). The neuroscience of grasp

文章图片
#人工智能#机器人
RAG优化:基于现代 SSD 的向量数据库性能优化总结

本文针对基于磁盘的向量数据库在AI应用中的I/O瓶颈问题,提出三项优化pgvector的核心技术:1)采用io_uring实现并行I/O,充分挖掘SSD并发性,查询QPS提升8.55倍;2)空间感知插入重排序提升缓存命中率,增量场景下保持74.35%命中率;3)局部性保留共置优化存储布局,使100M数据集缓存命中率仍提高2.7倍。实验表明,优化后的系统在真实数据集上实现查询吞吐量最高提升11.1倍

#人工智能#RAG
RAG优化

摘要:RAG本地AI知识库存在三大痛点:内容理解不足(如向量编码截断)、信息提取偏差(检索准确性依赖向量编码)和综合分析能力有限(缺乏深度推理)。进阶方案包括:引入重排序模型优化信息提取、采用MCPServer增强数据处理、使用超大上下文模型提升理解能力。相关资源可通过CherryStudio、硅基流动及PostGreSQLMCP等工具获取。(149字)

#人工智能#RAG#MCP
python自动化脚本pyautogui点击失效,pyautogui.click()失效

调用 .exe程序文件时候,当程序界面出来之后,鼠标失去反应,用pyautogui进行点击。后面尝试使用图片相似也无法实行点击。解决方法:运行Pycharm或者其他ide的时候选择以管理员权限启动即可。背景:在Pycharm里,使用python+

文章图片
#python
爬虫技术之规避验证码

各地工商网站(全称国家企业信用信息公示系统)因为包含大量企业真实信息,金融贷款征信等都用得到,天然吸引了很大部分来自爬虫的火力,因此反爬虫措施格外严格。一般的网站仅在登录注册等环节,或者访问频繁后才弹出验证码,而工商网站查询无需登录,每查一次关键字就需要一次验证码。同时各地工商网站由于各自独立开发,自主采用了各种不同的验证码机制,更是给全量爬取的爬虫增加了更多的障碍。因此,工商网站的验证码特别具有

#爬虫
Magnus:面向大规模机器学习工作负载的综合数据管理方法

Magnus是一个专为大规模机器学习工作负载设计的创新数据管理系统。针对传统数据湖表格式在存储效率、元数据管理和更新性能等方面的不足,Magnus提出了多项优化方案:1)自主研发Krypton列式格式和Blob多模态格式,显著提升存储和读取效率;2)通过消除冗余统计信息和构建索引优化元数据管理,使解析效率比Iceberg快5-26倍;3)支持轻量级的列级更新和主键Upsert机制;4)针对LLM和

#人工智能#机器学习#深度学习
利用大模型来做时间序列的预测

本文介绍了时间序列分析中的关键技术:1)Transformer架构及其改进版Informer,通过特征提取解决长尾问题;2)TimesNet将一维时序数据转换为二维;3)傅里叶变换分解影响因素并量化重要性。重点阐述了利用大模型实现文本域到时间域的映射方法:通过全连接层将时间片段(如缓慢下降、平缓上升)与文本patch绑定,使大模型适应时序分析。该方法结合了1D-2D转换、卷积特征提取等技术,为时序

#transformer#深度学习#人工智能
langgraph学习3 - demo

LangGraph是一个基于状态流转的流程图框架,核心包含四个概念:状态(state)作为数据载体,节点(node)作为处理单元,边(edge)连接节点,以及图(graph)组织流程。其执行逻辑为初始状态输入后,按节点和边的定义顺序处理并更新状态,直至终止。文中展示了两种实现案例:基础流程演示了状态传递和处理过程;条件分支案例则通过条件函数动态选择执行路径。两个案例都遵循定义状态、创建节点、构建边

#AI#人工智能
DepCache:面向GraphRAG的依赖注意力与KV Cache管理框架

摘要:针对GraphRAG系统存在的冗余计算和缓存复用效率低问题,研究者提出DepCache优化框架。通过依赖注意力机制(仅计算相关实体间的注意力)和图结构感知的KVCache复用策略,配合创新的LACR缓存替换算法,在Llama3等模型上实现:首Token延迟降低1.5-3.2倍,吞吐率提升1.5-5倍,缓存命中率提高6.7%-10.1%,同时保持生成质量。实验验证了结构感知微调和图KV复用的关

#人工智能#RAG
    共 171 条
  • 1
  • 2
  • 3
  • 18
  • 请选择