logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

图灵奖得主杨立昆:AI需要学习物理学才能继续进化,认为训练效率提升就不需要太多算力是误解,更多算力将用于推理...

来源:图灵人工智能本文内容整理自Yann LeCun在This Is World频道的专访,公开发表于2025年03月08日。原始内容参考:https://www.youtube.com/watch?v=RUnFgu8kH-4内容提要: 杨立昆在This Is World的访谈:AI的未来需要物理学人工智能现状及未来发展:当前AI系统在很多方面还很愚蠢,善于操纵语言,但不理解物理世界,缺乏持久记忆

#人工智能#学习
告别卡脖子,华为黑科技破局!昇腾推理加速1.6倍打破LLM降智魔咒

毫无疑问,算法创新与国产平台的结合,还将爆发出无法想象的巨大潜力!激活值的统计特性发生偏移,信息流在残缺的网络中传递受阻,最终导致剪枝后的模型性能大幅下降,陷入「一剪就坏,坏了难修」的困境,即便投入大量资源进行后续微调,也常常收效甚微。激进的剪枝操作会严重扰乱模型原有的参数分布平衡和精心学习到的信息流动路径,使得剪枝后的模型结构失稳,性能大打折扣,甚至难以通过后续微调恢复。的成功,关键在于其独特的

#科技
很好很强大,这款AI开发神器的图像标注吊打labelme

AI的发展有三大内核:数据、算法、算力。现如今,算法和算力在市面上的差距显然已经没有那么大,能够给AI提供充足弹药支持的当属数据了。深度学习算法精度的提升严重依赖于数据,谁的数据既多又准,...

#百度#人工智能#大数据 +2
自有歪果仁为DeepSeek「辩经」:关于DeepSeek的五个谣言

转自:机器之心围绕 DeepSeek 的谣言实在太多了。面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。虽然 R1 是开源的,围绕 DeepSeek 的各种夸张猜测还是层出不穷,有人说训练 R1 实际上使用的算力远超论文所说的,有人质疑 R

【机器学习】机器学习 vs. 数值天气预报,AI 如何改变现有的天气预报模式

数值天气预报是天气预报的主流方法。它通过数值积分,对地球系统的状态进行逐网格的求解,是一个演绎推理的过程。然而,随着天气预报分辨率不断升高,预报时间逐渐延长,NWP 模式所需要的算力迅速增加,限制了其发展。另一方面,以人工智能为基础的数据驱动天气预报快速发展,在部分领域已经超越了传统方法。现有的机器学习天气预报精度如何?人工智能又将如何改变天气预报?本文对比了几大数据驱动的机器学习天气预报模型后,

#人工智能#机器学习
【NLP】关于大模型训练常见概念讲解

随着LLM学界和工业界日新月异的发展,不仅预训练所用的算力和数据正在疯狂内卷,后训练(post-training)的对齐和微调等方法也在不断更新。下面笔者根据资料整理一些关于大模型训练常见概念解释。1 Pre-training(预训练) 预训练是指在模型的初始阶段,使用大量数据对模型进行训练,以便让模型学习到通用的特征和知识。这些特征和知识可以是语言模型中的词嵌入,或者是图像识别模型中的视觉模式。

#自然语言处理#人工智能#深度学习 +2
全面盘点,国内外大模型现状!

以OpenAI、Google、Anthropic为核心的头部阵营,在技术迭代速度(GPT-4.5到GPT-4.1的非线性版本演进)、多模态融合(Gemini 2.5 Pro支持10M token超长文本处理)、垂直领域突破(Claude 3.7 Sonnet Extended专注代码生成)等维度持续保持代际优势。2025年了,当初从CHatGPT的惊艳出场,到如今下场和各个大模型拼杀。:Suno

【Python】2025 最新出炉!15 个 Python 库带你飞

在Python的技术生态中,丰富多样的库是其一大亮点,这些出色的库大大拓展了Python的应用边界,堪称改变编程格局的“利器”。Ruff是基于 Rust 语言编写的超快速代码检查工具,其设计初衷便是凭借自身强大功能,以 “一器之力” 取代 Flake8、Black 和 isort 这几款传统工具,为开发者提供更高效、便捷的代码检查与格式化解决方案。:LangChain可以与OpenAI、Huggi

#python#开发语言
【深度学习】CVPR2025|LLMDet:在大语言模型监督下学习强大的开放词汇目标检测器

因此,作者引入了一些后处理步骤来清理数据集:第一,作者发现,尽管提示描述模型不要描述想象的内容,但模型仍然倾向于输出这类内容,不过会带有一些明显的词,如“indicating”“suggesting”“possibly”。例如,在图2中,“dishes”只是图像的一小部分,并且图像中有许多类似盘子的物体。在这个任务中,作者从检测器中选择正对象查询,即与标签分配中的真实边界框匹配的查询,并使用大语言

#深度学习#语言模型#学习 +2
10 大中文医学数据集汇总:涵盖神农中医药、中医药古籍、医学推理、医学问答……...

作者:李姝编辑:李宝珠转载请联系本公众号获得授权,并标明来源HyperAI超神经为大家准备了 10 个中文医学相关的数据集,支持在线使用与加速下载,快来体验吧~医疗人工智能的快速发展离不开高质量数据集的支持。从疾病诊断到药物研发,再到个性化医疗,数据集在推动机器视觉、大模型等应用于医学领域中发挥着不可或缺的作用。医学数据集的形式多样,涵盖了不同维度和领域的数据资源。例如,在疾病诊断领域,像 RJU

#数据挖掘#人工智能
    共 1403 条
  • 1
  • 2
  • 3
  • 141
  • 请选择