logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

科学家「黑进」果蝇大脑跑NLP任务,发现效率比BERT高

作者|机器之心编辑部来源|机器之心研究了半天人工神经网络,还不如复制粘贴动物的答案?最近一段时间,有关摩尔定律终结的讨论时常出现,深度学习越来越高的算力需求与芯片制造厂商们「挤牙膏」式...

#网络#算法#机器学习 +2
北京内推 | 京东广告部招聘NLP/大模型算法实习生

是京东的核心技术和业务部门,承担全站流量变现、收入提升的重要职责,部门基于京东海量的商品和用户数据,持续在深度学习、大模型等前沿领域发力,并在电商搜索/推荐广告核心业务场景取得应用。3. 使用技术:包括但不限于SFT、对齐微调、强化学习、大批量推理、模型蒸馏、多模态、数据质量优化等,通过探索LLM前沿技术提升在业务落地效果。欢迎加入我们,这里有卡有算力、有追求技术的年轻人和资深专家、有业务落地场景

#自然语言处理#人工智能
一文详解深度树检索技术(TDM)三部曲(与Deep Retrieval)

©作者 |wdmad来源 |数据科学の杂谈推荐系统的主要目的是从海量物品库中高效检索用户最感兴趣的物品,既然是“海量”,意味着用户基本不可能浏览完所有的物品,所以才需要推荐系统来辅助用户高效获取感兴趣的信息。同样也正是因为“海量”,由于算力的限制,复杂模型也是很难直接遍历每个物品算出分数来排序。如今的推荐系统通常大致分为召回(retrieval)和排序(ranking)两个阶段,召回是从全量物..

#算法#聚类#大数据 +2
一句话生成LoRA、长文档瞬间内化:大模型更新成本还能这样摊销?

推理时,仅凭接收视觉语言模型(Gemma-3-4B-it)提取的视觉激活值,超网络便直接为纯文本模型生成了具备视觉分类能力的 LoRA 权重,在 ImageNette 数据集上取得了 75.03% 的分类准确率。为适配不同的算力预算,Text-to-LoRA 构建了三种复杂度的超网络变体:生成完整 A 与 B 矩阵的大型架构(L)、使用共享特征投影的中型架构(M),以及高度压缩输出头的小型架构(S

新加坡内推 | Meta推荐系统团队招聘推荐系统算法/工程岗位

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!MetaMeta拥有全球最大的社交平台之一,面临着海量数据、超高算力和复杂算法等多重挑战,以支持其核心推荐系统。我们推荐系统团队的新加坡办公室在中国大陆寻找优秀的校招人才加入。此岗位将参与研究和落地下一代推荐算法,致力于提升用户体验并推动业务增长。推荐系统算法岗位坐标:新加坡性

#算法
128k死穴被击穿!Amazon爆改长上下文:段内压缩快4×,推理不掉点还更准

长上下文一直被认为是 LLM 最难攻克的“死穴”:平方级的计算复杂度带来算力瓶颈,KV 缓存的爆炸增长拖垮部署成本,而注意力的稀释更让模型在长序列中“迷失中间”。在 NarrativeQA、SQuAD、RACE 和 QuAIL 四个数据集上,CompLLM 的表现呈现出鲜明趋势:短上下文时与基线持平,但一旦超过 50k token,模型准确率显著反超,普遍提升 2–3 个百分点。因此,虽然「整块压

#人工智能#深度学习
Parameter-Efficient Fine-tuning 相关工作梳理

©PaperWeekly 原创 ·作者 |避暑山庄梁朝伟研究方向 |自然语言处理背景随着计算算力的不断增加,以 transformer 为主要架构的预训练模型进入了百花齐放的时代。看...

#机器学习#人工智能#深度学习 +2
8B模型媲美Claude?DeepResearch终于本地化了:拖入PDF,自动生成万字研报

基于技术团队的 UltraRAG 框架,它能高效挂载并理解您的本地私有知识库,让核心机密数据在“不出域”的前提下,安全地转化为极具价值的专业决策报告。这种对信息全方位的挖掘与重组能力,让小模型突破了逻辑瓶颈,产出的报告在严密性与洞察力上真正做到了越级挑战。光看跑分不够,我们直接上实战。你的数据,只属于你自己。无需昂贵的算力集群,无需上传核心数据,只需一张消费级显卡,你的本地文档库就能变成一个深度的

打破算力瓶颈!实现大模型智能更强涌现

我们已经进入大模型时代,据不完全统计,仅是国内正式发布的大模型就超过了 200 个,而且这些模型在不断的升级中,新的模型还不断发布出来,过去的一周多,中国农业大学发布了“神农大模型”,网易发布了“子曰”大模型 2.0 版本。模型的智能涌现水平同参数量有着直接关系,“大”仍是大模型升级的主流选择。以 GPT 为例,GPT-2 参数量为 15 亿,GPT-3 参数量为 1750 亿,提高了 100 倍

Vibe Researching来了!斯坦福教授实测:1小时自动复现PNAS论文

但一旦涉及需要购买或存储在离线环境中的私有数据(Proprietary Data),如详细的选民档案(Voter File),目前的 AI Agent 仍无法触达。在扩展分析中,AI 发现犹他州(UT)和华盛顿州(WA)在 2018 年后已经没有任何新的政策变异(Variation),所有的扩展效应其实都只来自加州。作者在复盘中非常诚恳地列出了当前的局限性,这对于试图复制该模式的研究者至关重要。为

    共 1508 条
  • 1
  • 2
  • 3
  • 151
  • 请选择