logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

别再逐 Token 生成啦!蚂蚁 LLaDA 2.1 文本扩散模型跑出 892 TPS 闪电速度

LLaDA 2.1的突破让我们看到,AI没必要一直像挤牙膏一样逐字生成。这种全局进化的模式一旦普及,AI写作和编程将从打字机时代跨入显影时代,一眨眼全文就位。这种瞬时生成的快感将彻底重塑交互节奏,让实时协作真正变得丝滑无感。这种高效率也意味着算力成本的断崖式下跌。当千亿参数的大模型能在随身设备上秒开秒回,AI就不再是昂贵的云端奢侈品,而是像空气一样无处不在的随身智囊。

文章图片
#语言模型
PaperBanana:NeurIPS 级学术图自动生成 | 论文内附官方提示词

论文链接:https://arxiv.org/abs/2601.23265发布时间:2026.01.30先划重点:论文附录里有可供参考。相信很多搞科研的朋友都深有体会,写论文最痛苦的往往不是推公式或做实验,而是画那张能撑起整篇论文门面的方法框图。以前咱们全靠手工在那儿拉框、连线、对齐,一坐就是大半天,手都要废了;后来生图大模型火了,大家觉得救星来了,不过总觉得差点意思,。最近看到北大和谷歌合作的一

文章图片
#AI绘图
强师未必出高徒?复旦提出 RSR 教你挑对大模型蒸馏的 “黄金数据”

论文链接:https://arxiv.org/abs/2601.14249发布时间:2026.02.02对于大模型炼丹师而言,不知道大家有没有这种经历,每次做的时候,心里其实特别虚。随手拿一批看似比较好的数据来训练,结果折腾半天,评估指标纹丝不动,甚至还倒退了。刚看到的这篇论文,它就把这种“炼丹玄学”用科学的方法给量化了。我们来看看它是怎样用一个指标把大模型蒸馏需要的的。

文章图片
无向量 RAG 有多强?PageIndex 凭树形索引革新传统语义检索

最近我刷到的文章,说实话,真的让人眼前一亮。官方对它的介绍是把它叫做“它最核心的魅力就在于:彻底抛弃了那种笨重的向量数据库,让 AI 像人类专家一样,。这一思路的提出,为受限于传统 RAG 应用瓶颈的开发者,带来了全新的解决方向与思路。

文章图片
#RAG
AI 绘图杀疯了!用自然语言秒生成漂亮图表 | AI Agent + draw.io

摘要: next-ai-draw-io是一款基于Next.js的AI绘图工具,结合大语言模型与draw.io,支持通过自然语言指令生成图表(如流程图、架构图),并能优化上传的手绘图、PDF等文件。其核心技术是通过AI将用户需求转化为draw.io的XML代码,再渲染为可视化图表,支持历史版本追溯与交互式修改。实际体验表明,生成效果依赖AI模型能力(推荐Claude Sonnet 4.5、GPT-4

文章图片
#人工智能
On-Policy Distillation:融合 RL 与蒸馏优势,让小模型实现 “低成本超神”

博客链接:https://thinkingmachines.ai/blog/on-policy-distillation/

文章图片
日涨 10k 星 | Clawdbot 开源 AI 助理,把 “贾维斯” 装进你的社交软件里

简单来说,Clawdbot 是一个开源的个人 AI 助理项目。它最神奇的地方在于,它不是一个像 ChatGPT 那样的独立网页或 App,而是一个“AI 网关”,把最聪明的 AI 大模型(比如 Anthropic 的 Claude)接到了你每天都在用的社交 App 里。你可以把它想象成一个住在你电脑里的“数字助理”或者“数字实习生”。你只要在 微信等社交软件里给它发个短信,它就能帮你去翻邮件、管日

文章图片
#开源#人工智能
Sentiment140情感分类数据

下载链接:https://www.kaggle.com/kazanova/sentiment140

#自然语言处理
详解kenlm语言模型计算过程

1.kenlm在python中的使用过程import kenlmmodel = kenlm.language("tri_gram_language_model.arpa")score = model.score("银行 放贷 行为")print(score)--------------------------------->>> -7.15396165847...

#自然语言处理
到底了