logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

TPAMI‘25 | 首个多轮、开放视角视频问答基准,系统分类9大幻觉任务

基准WildVideo针对多模态模型在视频问答中的「幻觉」问题,首次系统定义了9类幻觉任务,构建了涵盖双重视角、支持中英双语的大规模高质量视频对话数据集,采用多轮开放问答形式,贴近真实交互场景,全面评估模型能力。近年来,大模型在多模态理解领域进展显著,已能够在开放世界中处理图文甚至视频内容。然而,一个普遍且严重的问题「幻觉」始终制约着其实际应用。尤其在动态、连续的视觉场景中,模型可能生成与视频内容

文章图片
#AI#人工智能
一文读懂 RAG 检索、增强与生成核心技术拆解

RAG(Retrieval-Augmented Generation,检索增强生成)是由Facebook AI提出的一种融合检索与生成能力的自然语言处理技术,核心目标是提升大模型在知识密集型任务(如开放域问答、对话生成、专业文档撰写)中的准确性、时效性与可靠性。其核心思想是通过检索和生成的有机结合,弥补生成模型(如GPT、DeepSeek等)在处理知识密集型任务时的不足。在传统的LLM(大语言模型

文章图片
#人工智能#AI
智谱首席科学家唐杰:领域大模型是伪命题!AI模型应用的第一性不应是创造新App,在线学习和自我评估是新Scaling范式

唐杰认为,在 AGI 尚未实现之前,领域模型会长期存在,其背后更多是应用企业的战略选择——不愿意在 AI 企业面前完全失去主导权,希望通过领域 know-how 构建护城河,把 AI 驯化为工具。最近,清华大学教授、智谱AI首席科学家唐杰发了一条长微博,总结了自己2025年对大模型进展的感悟。从预训练到中后训练、长尾场景的对齐能力,再到Agent、多模态和具身智能的发展,其中有不少亮点。

文章图片
#人工智能#机器学习#AI
智谱首席科学家唐杰:领域大模型是伪命题!AI模型应用的第一性不应是创造新App,在线学习和自我评估是新Scaling范式

唐杰认为,在 AGI 尚未实现之前,领域模型会长期存在,其背后更多是应用企业的战略选择——不愿意在 AI 企业面前完全失去主导权,希望通过领域 know-how 构建护城河,把 AI 驯化为工具。最近,清华大学教授、智谱AI首席科学家唐杰发了一条长微博,总结了自己2025年对大模型进展的感悟。从预训练到中后训练、长尾场景的对齐能力,再到Agent、多模态和具身智能的发展,其中有不少亮点。

文章图片
#人工智能#机器学习#AI
智谱首席科学家唐杰:领域大模型是伪命题!AI模型应用的第一性不应是创造新App,在线学习和自我评估是新Scaling范式

唐杰认为,在 AGI 尚未实现之前,领域模型会长期存在,其背后更多是应用企业的战略选择——不愿意在 AI 企业面前完全失去主导权,希望通过领域 know-how 构建护城河,把 AI 驯化为工具。最近,清华大学教授、智谱AI首席科学家唐杰发了一条长微博,总结了自己2025年对大模型进展的感悟。从预训练到中后训练、长尾场景的对齐能力,再到Agent、多模态和具身智能的发展,其中有不少亮点。

文章图片
#人工智能#机器学习#AI
谷歌TPU挑战GPU王座!让Anthropic省下30%算力,买的TPU越多,省下的英伟达GPU支出就越多!网友:英伟达要慌了

谷歌的 Gemini 3 和 Anthropic 的 Claude 4.5 Opus 等前沿模型,并非使用英伟达硬件训练,而是运行在谷歌最新的 Ironwood 架构 TPUv7 上。面对谷歌TPU的攻势,英伟达开始紧张了。谷歌的 Gemini 3 和 Anthropic 的 Claude 4.5 Opus 等前沿模型,并非使用英伟达硬件训练,而是运行在谷歌最新的 Ironwood 架构 TPUv

文章图片
#AI#人工智能
GPT-5.1 Codex 比Claude便宜 55%,代码漏洞更少!全栈开发老鸟警告:Anthropic 需要重新考虑定价了!

最终结论是GPT-5和GPT-5.1 Codex 的表现非常出色,它们真正交付了可上线运行的代码,漏洞最少;他也分析了每个模型各自的长处:Sonnet 4.5擅长提供高质量、经过充分推理的架构设计和文档输出,Kimi则胜在创意十足且成本低。现在已经有太多能写代码、而且写得非常好的模型了。Sonnets、Haiku 4.5、Codex 系列、GLM、Kimi K2 Thinking、GPT 5.1…

文章图片
#AI#人工智能
兵临OpenAI!谷歌集结2500人「复仇」,Gemini 3夺回AI王座

谷歌AI的集体胜利:Gemini 3发布,参与人数媲美NASA登月!从芯片到算法的全栈专家合力,Koray与Logan剖析工程协作的魅力。伴随Gemini 3的发布,谷歌一举问鼎AI王座!曾经被认为处于「落后」状态的谷歌,如今正凭借一系列技术、战略与资源优势,试图夺回在生成式AI时代的主导地位。近期,谷歌DeepMind的CTO Koray Kavukcuoglu与谷歌AI Studio产品Log

文章图片
#人工智能#AI
AI 小白逆袭!用 10 分钟学会 Claude Code 接入 DeepSeek-V3.2

DeepSeek发布了最新的模型DeepSeek-V3.2,我们今天就让Claude Code 接入DeepSeek。为了让你也能快速掌握这套流程,我特地写下这篇“从零开始、一步到位”的完整实战教程。大家好,我是写代码的中年人!DeepSeek发布了最新的模型DeepSeek-V3.2,我们今天就让Claude Code 接入DeepSeek。为了让你也能快速掌握这套流程,我特地写下这篇“从零开始

文章图片
#人工智能#AI
Gemini手搓3D粒子特效,体验现实版钢铁侠

无需懂一行代码,Gemini 3正在重塑3D交互创作的边界!详细对比了Canvas与AI Studio在开发场景下的独特优势,带你亲身体验这场「零门槛」的3D交互革命。Gemini 3的威力其实并没有被很多人真正的意识到。最近,演示了如何仅通过简单的提示词,生成一个用户可以通过来直接控制粒子群的缩放和扩散。用同款提示词在Gemini Canvas试了一下,简直惊掉了下巴。还可以升级,现在是识别一只

文章图片
#人工智能#AI
    共 114 条
  • 1
  • 2
  • 3
  • 12
  • 请选择