logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

flink5_自定义函数

自定义函数(UDF)可以用 JVM 语言(例如 Java 或 Scala)或 Python 实现,实现者可以在 UDF 中使用任意第三方库,本文聚焦于使用 JVM 语言开发自定义函数。原文档:https://nightlies.apache.org/flink/flink-docs-release-1.16/zh/docs/dev/table/functions/udfs/

#java#开发语言#flink
安德鲁·卡帕西:深入探索像ChatGPT这样的大语言模型

本文总结了安德鲁·卡帕西关于大语言模型的核心观点。大模型训练分为三个阶段:预训练(学习语料)、监督微调(学习对话)和强化学习(优化输出)。预训练包括数据处理、token化和神经网络参数调整;监督微调通过对话数据集教会模型应答;强化学习则让模型自主优化答案质量。文章还探讨了模型特性(如幻觉、记忆方式)和发展方向(多模态、任务代理等),并提供了相关资源链接。这种分阶段训练方法使大模型能逐步掌握从知识积

文章图片
#语言模型#人工智能
大模型知识编辑技术——李宏毅2025《机器学习》第十讲

本讲聚焦模型编辑(Model Editing)技术,精准地修改大语言模型(LLM)中的单一知识点,而不像微调一样影响模型整体能力。本文讲解了评判模型编辑的三个原则(可靠性、泛化性、局部性)和模型编辑的两大方法(1、不改变模型参数的算法,如IKE;2、改变参数,如人类参与的ROME, 人不参与的Hypernetwork)

文章图片
#人工智能#机器学习#算法
大模型知识编辑技术——李宏毅2025《机器学习》第十讲

本讲聚焦模型编辑(Model Editing)技术,精准地修改大语言模型(LLM)中的单一知识点,而不像微调一样影响模型整体能力。本文讲解了评判模型编辑的三个原则(可靠性、泛化性、局部性)和模型编辑的两大方法(1、不改变模型参数的算法,如IKE;2、改变参数,如人类参与的ROME, 人不参与的Hypernetwork)

文章图片
#人工智能#机器学习#算法
机器学习中的数据预处理方法

数据预处理方法:处理缺失数据、处理类别数据、划分训练数据集和测试数据集、保持相同的特征缩放

文章图片
#机器学习#人工智能
计算广告中涉及的设备id:oaid、androidid、imei、idfa、caid

计算广告中的设备ID,以及简单的发展历史

#算法
打造推理模型的4种方法——李宏毅2025大模型课程第7讲

本节课系统地介绍了如何让大语言模型(LLM)具备“推理”能力,介绍了打造推理模型的4种流派,并介绍了集4种技术流派大成的deepseek R1。最后提出了推理模型的挑战在于:推理过程冗长、效率低和成本高

文章图片
#人工智能
打造推理模型的4种方法——李宏毅2025大模型课程第7讲

本节课系统地介绍了如何让大语言模型(LLM)具备“推理”能力,介绍了打造推理模型的4种流派,并介绍了集4种技术流派大成的deepseek R1。最后提出了推理模型的挑战在于:推理过程冗长、效率低和成本高

文章图片
#人工智能
因果推断、用户增长、广告系统 文章合集

本文持续收集一些与用户增长、广告投放相关的因果推断文章。(更新日期:2023-08-09)(更新日期:2021-07-08)

文章图片
#算法
大语言模型的后训练与“灾难性遗忘”问题——李宏毅2025大模型第六讲笔记

当你看到这样一个新闻:“某实验室/公司喜报:使用某开源基座模型Q,经过后训练得到模型Q',Q'在数学编程领域的得分超过Q。” 请思考,Q'真的超过了Q吗?学习本节课,你将得到答案

文章图片
#语言模型#人工智能
    共 30 条
  • 1
  • 2
  • 3
  • 请选择