logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

PU learning 算法笔记1-- 论文《Learning Classifiers from Only Positive and Unlabeled Data》中的方法

PU learning 算法笔记 -- 论文《Learning Classifiers from Only Positive and Unlabeled Data》中的方法。

文章图片
#算法#机器学习
强化学习 GAE算法:HIGH-DIMENSIONAL CONTINUOUS CONTROL USINGGENERALIZED ADVANTAGE ESTIMATION》论文笔记

论文《HIGH-DIMENSIONAL CONTINUOUS CONTROL USINGGENERALIZED ADVANTAGE ESTIMATION》是策略梯度算法中常用的优势估计算法GAE对应的论文

文章图片
#论文阅读
综述《Unifying Large Language Models and Knowledge Graphs: A Roadmap》统一大语言模型和知识图谱笔记

综述《Unifying Large Language Models and Knowledge Graphs: A Roadmap》统一大语言模型和知识图谱粗略笔记

文章图片
#语言模型#知识图谱#论文阅读
大模型基础之位置编码RoPE

大模型基础之位置向量RoPE

文章图片
#transformer
大模型对齐方法笔记三:不需要参考模型的对齐方法ORPO和SimPO

不需要参考模型的对齐方法ORPO和SimPO简介

文章图片
大模型对齐方法笔记四:针对领域问答来进行知识对齐方法KnowPAT

针对领域问答来进行知识对齐方法KnowPAT,KnowPAT(Knowledgeable Preference AlignmenT) 出自2023年11月的论文《Knowledgeable Preference Alignment for LLMs in Domain-specific Question Answering》

文章图片
#论文阅读
大模型对齐方法笔记一:DPO及其变种IPO、KTO、CPO

大模型对齐方法DPO及其变种IPO、KTO、CPO原理

文章图片
#机器学习#人工智能
PET-SQL:基于大模型的两阶段Text2SQL方法

PET-SQL出自论文《[PET-SQL: A Prompt-enhanced Two-stage Text-to-SQL Framework with Cross-consistency](https://arxiv.org/abs/2403.09732)》,将基于大模型的Text2SQL分为两个阶段进行。

文章图片
#深度学习
基于decoder-only LLM 的embeddings:LLM2Vec、Echo embeddings、PromptEOL、E5-mistral-7b-instruct、Sgpt等

基于decoder-only LLM得到embedding的方法:LLM2Vec、Echo embeddings、PromptEOL、E5-mistral-7b-instruct、Sgpt、RepLLaMA 、cpt-text、UDEVER

文章图片
#深度学习#人工智能
强化学习论文《Deep Reinforcement Learning that Matters》笔记

强化学习论文《Deep Reinforcement Learning that Matters》笔记

文章图片
#论文阅读
    共 61 条
  • 1
  • 2
  • 3
  • 7
  • 请选择