
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Activation Beacon出自论文《Long Context Compression with Activation Beacon》(v1版的题目:Soaring from 4K to 400K: Extending LLM’s Context with Activation Beacon)。它引入了Beacon token将上下文信息蒸馏到其激活(activations)。

论文《How to Fine-Tune BERT for Text Classification?》是2019年发表的一篇论文。这篇文章做了一些实验来分析了如何在文本分类场景下微调BERT,是网上讨论如何微调BERT时经常提到的论文。

不需要参考模型的对齐方法ORPO和SimPO简介

大模型基础之位置向量RoPE

综述《Unifying Large Language Models and Knowledge Graphs: A Roadmap》统一大语言模型和知识图谱粗略笔记

LLM agentic论文《Self-Refine: Iterative Refinement with Self-Feedback》《Reflexion: Language Agents with Verbal Reinforcement Learning》《CRITIC: Large Language Models Can Self-Correct with Tool-Interactive

Leiden算法出自2019年的论文《From Louvain to Leiden: guaranteeing well-connected communities》,它是Louvain算法的改进社区发现算法,相比Louvain得到的社区质量更高,因为其移动策略速度也更快。Leiden算法也是以论文作者所在城市来命名的。

综述《Unifying Large Language Models and Knowledge Graphs: A Roadmap》统一大语言模型和知识图谱粗略笔记

异常检测算法LOF(local outlier factor)出自2000年的SIGMOD论文《LOF: Identifying Density-Based Local Outliers》,它包括k-近邻距离、可达距离、局部可达密度、局部异常因子等概念。

如何从多维时序数据(如传感器数据)中发现异常事件比如系统错误或者攻击呢? 我们怎样去捕获传感器之间的复杂关系呢?并利用这些关系来检测并解释偏离关系的异常事件呢? 论文尝试提出一种名叫Graph Deviation Network (GDN) 的方法来解决这些问题,通过在两个实际数据集上进行实验证明该方法比基准方法在准确性上更好,并且具有可解释方便用户定位和理解异常行为。







