
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
从ReAct的论文中(参考1),可以看到,单纯用COT,也会存在一些问题,靠COT也无法很好的回答问题,如下图所示

1. 引入我们之前已经了解了RNN中的GRU[2]和LSTM[3]。怎么样才能进一步优化RNN这样的模型呢?就是使用双向RNN,它能使得我们在序列的某点处,不仅获取之前的信息,还能获取将来的信息。将来的信息是什么意思呢?为什么根据之前的信息还不足够网络做决策?我们看下面的一个例子:用传统RNN做NER,判定某个单词是否为人名。例子中给出的两句话,第一句话中的Teddy不是人名(是泰迪熊...
如何调试第三方库,如何才能动态看到第三方库中的中间结果?
1. 引入深度学习模型,大都是多层的网络,各个层可能各有不同(Dense, Dropout, Flatten, Activation, BatchNormalization, GlobalAveragePooling2D,Conv2D, MaxPooling2D, ZeroPadding2D,LSTM)。有时候我们需要获取多层网络中某一层的输出值,用于做可视化,或者Embedding。下面就以一个
Abstract在《基于深度学习的目标检测思路》中,提到了可以用滑动窗口的思路来做目标检测。除了滑动窗口,还有其他的目标检测算法吗?目标检测介绍传统的目标检测算法,都是基于滑动窗口,训练模型的,如下图所示。该方法对目标的标注,需要标注目标的位置、大小、类型等信息,标注成本是很高的。但是,做目标检测是少不了这个标注工作的。这种传统的滑动窗口目标检测方法,最大的缺点是: 窗口大...
从SVM的模型表达式开始,理解SVM的各关键点
LLaMA-Factory微调ChatGLM3报错: Segmentation fault (core dumped)
引入surprise是Simple Python Recommendation System Engine的缩写,是一个为了实现推荐系统的框架。它自带了SVD,user-based,item-based协同过滤算法等多种推荐算法,接口简单,功能强大。但官方文档写的并不好,笔者花了不少时间,都没有找到如何预测某个user对某个item进行打分这样的基础用法,所以把摸索后得到的经验分享于此。数据集..
大模型训练中的 Pre-Training,Fine-Tuning,In-Context Learning,Reward Modeling,PPO,DPO,RLHF的含义与区别。

最近几年,jupyter在全球数据科学领域,已经成为不可或缺的重要工具。在jupyter中用python写程序,若import了自己写的外部模块,如果这个外部模块有更新,再次执行import,jupyter是不会重新导入的。一般的做法是先restart整个jupyter文档,再重新执行代码,以确保所有导入的外部模块都是最新的。但这种做法太麻烦,效率也不高。网上搜“jupyter auto re..