鲸鱼在dn 个人主页

@qq_41697157

鲸鱼在dn

2023-11-20 15:27:58 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大型语言模型推理能力评估——李宏毅2025大模型课程第9讲内容

本节课主要探讨了“如何科学评估大型语言模型的推理能力”，指出当前模型可能依赖记忆而非真正推理，介绍了 ARC-AGI 和 Chatbot Arena 等评估平台，并提醒人们注意评估指标的局限性和误导性。

#语言模型 #人工智能 #自然语言处理

flink5_自定义函数

自定义函数（UDF）可以用 JVM 语言（例如 Java 或 Scala）或 Python 实现，实现者可以在 UDF 中使用任意第三方库，本文聚焦于使用 JVM 语言开发自定义函数。原文档：https://nightlies.apache.org/flink/flink-docs-release-1.16/zh/docs/dev/table/functions/udfs/

#java #开发语言 #flink

安德鲁·卡帕西：深入探索像ChatGPT这样的大语言模型

本文总结了安德鲁·卡帕西关于大语言模型的核心观点。大模型训练分为三个阶段：预训练（学习语料）、监督微调（学习对话）和强化学习（优化输出）。预训练包括数据处理、token化和神经网络参数调整；监督微调通过对话数据集教会模型应答；强化学习则让模型自主优化答案质量。文章还探讨了模型特性（如幻觉、记忆方式）和发展方向（多模态、任务代理等），并提供了相关资源链接。这种分阶段训练方法使大模型能逐步掌握从知识积

#语言模型 #人工智能

大模型知识编辑技术——李宏毅2025《机器学习》第十讲

本讲聚焦模型编辑（Model Editing）技术，精准地修改大语言模型（LLM）中的单一知识点，而不像微调一样影响模型整体能力。本文讲解了评判模型编辑的三个原则（可靠性、泛化性、局部性）和模型编辑的两大方法（1、不改变模型参数的算法，如IKE；2、改变参数，如人类参与的ROME, 人不参与的Hypernetwork）