logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI顶会NeurIPS论文数,中国占半壁江山!黑马港科广亮眼

作为全球AI领域的年度最大学术盛事之一,今年的NeurIPS呈现出一种前所未有的撕裂感:一场会议,两个主场——一边是算力与资本的圣地硅谷的「后花园」,另一边则是由于签证壁垒而被迫形成的「平行宇宙」。而在OpenReview滚动的录取名单背后,一个更具历史意味的转折点正在浮现:清华大学,这所中国最顶尖的学府,正以一种不可阻挡的态势逼近长期的霸主谷歌。在LLM推理成本高企的背景下,千问团队提出了一种带

#人工智能
周志华:“数据、算法、算力”人工智能三要素,在未来要加上“知识”| CCF-GAIR 2020...

本文转自AI科技评论作者 |李雨晨编辑 |丛末2020 年 8 月 7 日,全球人工智能和机器人峰会(CCF-GAIR 2020)正式开幕。CCF-GAIR 2020 峰会由中国计算机...

#人工智能#算法#大数据 +2
就在刚刚,GPT-5正式发布!已达博士水平,人人都能免费使用!

看到日程后GPT-5可以自动进行一些助理级工作,比如发现未回复的邮件等。在语音对话方面,现在不仅可以让GPT-5充当外语老师,还能定制语音、让GPT-5根据你的需求来灵活教学,比如调整语速。在写作方面,GPT-5相比前代也有明显提升,它不再局限于模版化的表达,而是能够根据上下文生成富有个性与情绪的表达,GPT-5看到用户提示词后再判断是否执行,同样的提示在不同语境下,GPT-5可能有不同的执行结果

#人工智能
智谱发布首个具备深度研究和操作能力的AI Agent

这是因为智能体任务往往涉及多轮复杂交互,32B的参数量使得 GLM-4-Air-0414 能快速执行复杂任务,为AI智能体的真正大规模落地应用提供了坚实基础。将免费模型 GLM-4-Flash 的基座版本更新至 GLM-4-Flash-0414,并推出了对应的推理版本 GLM-Z1-Flash,在保留大部分效果的情况下。AutoGLM 沉思背后的模型,是我们全新推出的Agent大脑——沉思模型,即

#人工智能
下载量突破 22 万!MiniCPM-V 4.5 刚刚公布了最新技术报告!

尽管仅有 8B 参数规模,模型在视觉语言能力上超越了 GPT-4o-latest 等广泛使用的专有模型,以及 Qwen2.5-VL 72B 等强大的开源模型,成为 30B 参数以下性能最佳的开源多模态大模型。自 OpenAI 发布 GPT-4 以来,多模态大模型深刻地改变了人工智能研究和产业的基本范式,在理解和推理图文语义信息方面展现出革命性能力,但其庞大的参数量和高昂的计算成本,使其严重依赖云端

通义RAG团队开源LaRA框架: 模型越弱,RAG提升越猛?

来源:NLP前沿阿里通义RAG团队等提出RAG与长文本对比新框架,助力智能路由决策机制设计论文标题:LaRA: Benchmarking Retrieval-Augmented Generation and Long-Context LLMs - No Silver Bullet for LC or RAG Routing论文地址:https://arxiv.org/abs/2502.09977开

阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜

这个成绩不仅超过了OpenAI-o3-mini(70.4分)、Qwen3-235B-A22B(70.6分),甚至和Claude-3.7-Sonnet-Thinking(70.7分)打成平手。在DocMath、Frames、2WikimQA等七个长文本基准测试中,QwenLong-L1-14B相比基础模型R1-Distill-Qwen-14B,平均提升了4.1分,超越了Gemini-2.0-Flas

18岁天才少年,登上Nature封面!

2022年加入DeepSeek,并参与了DeepSeek-Coder、DeepSeek-V2、DeepSeek-Coder-V2、DeepSeek-V3、DeepSeek-R1等几乎所有重要项目的研发。年仅18岁的天才少年涂津豪作为作者之一,以实习生身份参与其中,他的故事从高中生到Nature作者,堪称励志传奇。凭借Claude的强大性能,结合Thinking Claude思维模式的加持,再配上强

vLLM 推理引擎的核心优化技术及其工作流程

这种方法巧妙地结合了两种并行策略:专家并行用来处理 MoE 层的巨大专家数量,而数据并行则用来高效地处理非专家层的计算,从而在保证高吞吐量的同时,支持超大规模的 MoE 模型。这种混合并行方法将模型的两个维度都进行了切分:流水线并行切分了模型的层(垂直方向),而张量并行切分了每一层的权重(水平方向),从而能够服务那些规模巨大的模型。All-reduce 是一种高效的通信操作,它能让所有设备上的部分

再见Cursor!谷歌放大招刷爆AI编程榜!

在官方博客中,他们还表示:这个版本原计划在几周后的Google I/O大会上发布,但由于Gemini 2.5太受欢迎,于是决定现在发。就在前几天,Gemini 2.5 Pro在直播中通关了《宝可梦蓝》,成为首个大模型宝可梦联盟冠军,直接打破了此前Claude的记录。此次更新的重点就在于编码能力,包括不限于改进前端和UI开发,以及基础编码任务(例如代码转换和编辑,以及创建复杂的代理工作流)。除此之外

    共 305 条
  • 1
  • 2
  • 3
  • 31
  • 请选择