logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

白话大模型评估:文本嵌入与文本生成模型评估方法详解

本文介绍了大语言模型的两类核心评估方法:文本嵌入模型和文本生成模型。对于文本嵌入模型,重点阐述了准确率、精确率、召回率和F1分数等核心指标及其计算方法,并提供了基于LCQMC数据集的评估代码示例。文本生成模型评估部分则详细解析了BLEU、ROUGE和困惑度等指标的特点与适用场景,同时给出了完整的评估流程代码。文章通过具体示例展示了如何从数据加载到指标计算的全过程,为读者提供了实用的模型评估参考框架

零基础理解LangChain框架

LangChain是一个简化大模型应用开发的框架,支持聊天机器人、智能问答、翻译助手等场景开发。它通过模块化架构,提供模型管理、任务链、记忆存储、代理工具、信息检索和提示词模板等功能。

一文看懂log函数在大模型中的作用

Log函数(对数函数)是数学中的逆运算工具,能将指数问题转化为简单运算。核心特性包括:将乘法变加法、压缩数值范围、解决指数方程。在大模型训练中,Log函数通过交叉熵损失函数和Softmax激活函数优化计算,避免数值下溢,提升训练稳定性。总结来说,Log函数是处理复杂运算的"数学转换器",让大数计算和模型训练更高效可控。

#机器学习
大模型训练中的 logits 是什么

摘要:Logits是大模型输出的原始得分,直接反映模型对不同类别的倾向性,但尚未转换为概率。它是模型最后一层神经网络的原始输出,数值越大表示模型越倾向该结果。

一文看懂Hugging Face和LangChain的区别

Hugging Face的核心是大模型,包含模型的托管、训练、微调,以及数据集的托管。LangChain的核心是大模型应用,简化应用开发流程。

小白也能理解LangGraph节点和边的概念

LangGraph框架通过节点和边的概念构建处理流程。节点对应具体的处理函数(如处理用户输入、调用AI接口、格式化输出),边则定义执行顺序和数据流向。

jquery获取URL参数

本文转自:http://blog.csdn.net/salc3k/article/details/7286296

#jquery
IT行业导览-4.3-数据分析师

岗位名称数据工程师,数据科学家。定义数据分析,是指用适当的统计学方法对大量数据进行分析,为提取有用信息和形成结论,而对数据加以详细研究和概括总结的过程。定义中的几个名词:统计学、大量数据、详细研究。统计学就是统计学科,我们以前学的求平均数、方差、中位数等等,跟数学联系比较紧密,统计学学得好是做数据分析的基础。大量数据分析目标规模要大,小规模数据体现不出群体的特征,代表不了群体

#数据分析
vmware设置桥接时复制物理网络连接状态是什么意思?

本文转自:http://zhidao.baidu.com/link?url=ucHG-fAobNYbZNscClNNM46vdXeC1v4r8EZtgH0Rumk2I6tgUvnlkUusm-1PlIM0Q4gmj6mozZezxNMvQFFRDK,未作修改。意思就是说,VM上使用的是虚拟的网卡,也就是说VM虚拟机上的网卡不是真实存在的,而桥接还有其他的网路链接方式,都是必须存在网

VM虚拟机装centos无法自动获取IP的解决方法

本文转自:http://www.9upk.com/article/2458.html,未作修改。在虚拟机VM里面装了centos系统,网卡选用桥接方式。刚开始的时候还能自动获取到IP地址,突然有一天IP消失了,再怎么重启都无法获取IP地址。因为之前是可以获取IP,而且 VMware NAT Service 和 VMware DHCP Service 两个已启动,

#centos
    共 13 条
  • 1
  • 2
  • 请选择