logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

“多选几个大模型”真的会变强吗?RouterEval 给了一个残酷前提:先把 router 练到够靠谱

你可能也遇到过:同一个输入,换个 LLM 结果就像开盲盒——有的秒懂,有的胡编。直觉上,“那我就多接几个模型,总能撞上会的那个”似乎很合理。特别是:论文在 Limitations 里指出,;候选太多可能带来部署挑战。这形成了一个很现实的张力:Routing LLMs 被讲成“规模化”的新范式,但可落地的甜点区,反而可能要求你。

文章图片
#人工智能#自然语言处理#语言模型
谁给了 AI “上帝模式”?4万个 Agent Skills 背后的疯狂、泡沫与隐患

在深入数据之前,我们需要先理解什么是。对于计算机专业的学生来说,你可以这样理解:如果 LLM 是操作系统(OS),那么 Agent Skill 就是应用程序(App)。在没有 Skill 之前,AI 只能生成文本;有了 Skill,AI 就能执行特定的程序逻辑、调用外部工具或 API。元数据 (Metadata):类似于 API 的签名(Signature),定义技能的名称和描述,用于 AI 在海

文章图片
#人工智能#自然语言处理#语言模型
CMU Subword Modeling | 06 Computational Approaches to Morphological Segmentation and Tokenization

这次课主要讲,它们是目前 NLP 系统中做最常用的技术:Byte-Pair Encoding, Wordpiece, Unigram tokenization, SentencePiece, Morfessor (

#机器学习#自然语言处理#人工智能 +1
一口气读懂 Agent Skills:40,000+ Claude Skills 背后的生态、机会与风险

从爆发式增长规律、全维度功能分类到多等级安全审计,这份数据驱动的研究,清晰呈现 Agent Skills 的社区生态和发展现状,既为技术落地研发、搭建平台提供了硬核量化参考,也让入门者能清晰看懂这一领域的真实全貌。

文章图片
#人工智能#语言模型#自然语言处理 +3
[ICLR 2026] 一文读懂 AutoGEO:生成式搜索引擎优化(GEO)的自动化解决方案

生成式搜索流量密码被破解!AutoGEO 框架自动学习 ChatGPT/Google AI 偏好规则,无需人工试错。API 版零训练直接用,轻量版成本仅 0.0071 倍,曝光率狂提 35.99% 还不影响回答质量。跨领域通用 + 开源可用,技术人必看的 GEO 落地方案~

文章图片
#搜索引擎#语言模型#人工智能 +3
8-连续非负整数

题目描述给出一个正整数N和长度L,找出一段长度大于等于L的连续非负整数,他们的和恰好为N。答案可能有多个,我们需要找出长度最小的那个。例如 N = 18 L = 2:5 + 6 + 7 = 183 + 4 + 5 + 6 = 18都是满足要求的,但是我们输出更短的 5 6 7 。Me主要使用了队列的思想,绕了一大圈还运行超时……import java.util.Scanner;public cla

#数据结构
阅读——TF-IDF算法

博文TF-IDF算法介绍及实现主要介绍了TF-IDF,包括原理、不足、实战。阅读问题的提出中包含了对TF-IDF的拓展。TF-IDF(term frequency–inverse document frequency,词频-逆向文件频率)是一种用于信息检索(information retrieval)与文本挖掘(text mining)的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于

#机器学习#nlp
SPSS-参数检验

1.假设检验假设检验分为参数检验与非参数检验。(1) 参数检验:已知总体分布, 猜测总体的某参数(原假设H0,null hypothesis),用一组样本来检验这个假设, 是否正确 (即接受还是拒绝假设H0)。(2) 非参数检验:两总体的分布未知,检验两总体分布是否一致(用两组样本来检验);由样本分布推测其总体分布 (假设H0),用另一组样本来检验这个假设,是否正确。1.1.正态总体下的参数假设检

#数据分析
PyTorch3D 可视化

PyTorch3D是非常好用的3D工具库。但是PyTorch3D对于可用于debug(例如调整cameras参数)的可视化工具并没有进行系统的介绍。这篇文章主要是想介绍我觉得非常使用的PyTorch3D可视化工具。

文章图片
#pytorch#3d#人工智能
SPSS-多重响应分析

多重响应分析两个问题,问题一使用了中文SPSS,问题二使用了英文版SPSS。名词解释穿插在操作步骤中。Q5:经常进行的网络活动(多选,10个可选项)数据介绍问题5对应数据集中下述字段:操作步骤(1)定义多重响应集此处变量编码方式中选择的是“二分法”,二分法的基本方式是,多选题有多少个选项就设计多少个变量,每个变量分别有“是”和“否”两种回答,如果选择了该选项,对应为“是”,否则为“否”,分别赋值为

#数据分析
    共 12 条
  • 1
  • 2
  • 请选择