logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Langchain-Chatchat的markdownHeaderTextSplitter使用

开源项目开箱即用是好事,但是直接拿来做产品还是欠佳的,怪不得大家最终都会走到自定义分词器的步骤,业务的需求千变万化,代码都掌握在自己手里才能以不变应万变啊。

文章图片
Langchain-Chatchat之pdf转markdown格式

在使用Langchain-Chatchat做RAG的时候,发现导入的pdf文件中的表格关系无法保存,导致LLM的回答不符合预期。例如我想问的内容在表格中,但LLM的回答并不是对表格的总结。那么想要解决这个问题,就需要找到一种合适的文本格式来保留表格间的关系,然后修改Langchain-Chatchat的文本加载源码,使pdf文本转换成目标的文本格式,也就是本篇的markdown格式。

文章图片
nodejs+wasm+rust debug及性能分析

wasm正逐渐走进我们的程序生活,不少计算库都在用高性能语言重写,并通过wasm作为第三方包提供能力。例如博主最近用到的渲染相关的计算包,基本都是用c++和rust实现的,然后web端直接调用wasm即可。刚好趁着这个机会,debug一下node,wasm,还有最底层的rust。

文章图片
#wasm#rust
vscode打造golang开发环境以及golang的debug单元测试

一.前言      vscode使用的顺手了,真的很难再换到沉重的ide去。但是vscode的debug确实比不过老牌ide自带的,因此只能靠咱们自己去安装了。。二. 正文1.vscode的扩展(1)搜索扩展go,安装(2)ctrl_cammand+P ,输入go:install,翻墙下载插件(3)如果设置了go mod方式,那么vsco

#vscode#golang#单元测试
c++传输二进制数据

c++传输二进制数据,那么传输的数据要如何转换成二进制呢?二进制传输本质上传的是什么?为什么要进行指针的类型转换和长度转换?疑问有很多,不得不总结下了。

#c++#算法#开发语言
jquery的四层联动插件jquerySelect

一、前言      关于这个插件,以前是分享过一次的,奈何在这次的使用中又一次的遇到了不少坑,而且上次分享也少了js下载的步骤,所以这次补齐一下吧。可能有人会觉得不就是四层联动嘛,框架里面都带的有,可是老铁啊,我们的项目没前端框架,依然是jquery的天下。。多级联动下拉菜单插件:jquery.cxselect.js二、引入步骤&...

#jquery
自定义神经网络二之模型训练推理

通过上一篇文章,我们大概了解了神经网络以及常见的神经网络结构和应用场景。但是在日常与算法同学打交道中,基本都是算法同学提供模型,工程化同学进行推理获取结果。那么模型是什么,怎么产生的模型,模型训练和推理又是干嘛的呢?下面我们一一道来。

文章图片
#神经网络#人工智能#深度学习
Langchain-Chatchat的markdownHeaderTextSplitter使用

开源项目开箱即用是好事,但是直接拿来做产品还是欠佳的,怪不得大家最终都会走到自定义分词器的步骤,业务的需求千变万化,代码都掌握在自己手里才能以不变应万变啊。

文章图片
Langchain-Chatchat之pdf转markdown格式

在使用Langchain-Chatchat做RAG的时候,发现导入的pdf文件中的表格关系无法保存,导致LLM的回答不符合预期。例如我想问的内容在表格中,但LLM的回答并不是对表格的总结。那么想要解决这个问题,就需要找到一种合适的文本格式来保留表格间的关系,然后修改Langchain-Chatchat的文本加载源码,使pdf文本转换成目标的文本格式,也就是本篇的markdown格式。

文章图片
自定义神经网络四之编写自定义神经网络

本博客是在大佬代码的基础上,实现了自定义神经网络的训练和推理。外网上的优秀文章和视频太多了,可惜限于网络和语言,能被我们看到的太少了。 这个大佬40多分钟就手撸了简单的神经网络类,并且实现了训练和推理,博主只能说,牛逼。本系列文章到这里就结束了。本来只是想分享一下大佬的视频和代码,但直接输出难免会没有上下文,因此只能把以前的一些笔记梳理下,期望读者能先有一些基础概念,然后再手撸代码实现一个自己的神

文章图片
#神经网络#人工智能#深度学习
    共 64 条
  • 1
  • 2
  • 3
  • 7
  • 请选择