logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

全新DeepSeek V3-0324发布:人工智能搜索的新突破

例如,在“动态天气卡片”测试中,新版V3生成的代码逻辑完整性与可执行性远超R1版本。,结合强化学习驱动的自我验证机制,显著降低训练成本(初代V3仅耗资557.6万美元即实现媲美Claude 3.5的性能)。:发布数小时内,衍生出23个垂直领域微调模型(如医疗问答、法律文书生成),形成“模型雨林”生态。:针对开发者呼声最高的编程与对话体验优化,此次升级为R2的“全模态能力”埋下伏笔。:企业用户反馈,

#人工智能
LLM Tech Map 大模型技术图谱

分享一个LLM Tech Map 大模型技术图谱从基础设施、大模型、Agent、AI 编程、工具和平台,以及算力几个方面,为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。核心价值:帮助技术人快速了解 LLM 的核心技术和关键方向。...

回望我在谷歌的 18 年 [译]

今天这篇谷歌员工写的“Reflecting on 18 years at Google”很火,翻译过来给大家欣赏一下我于 2005 年 10 月加入谷歌,18 年后,我递交了辞呈。上周,我结束了在谷歌的最后一段日子。对于能够亲历谷歌上市初期的时光,我感到非常幸运;不同于大多数公司,与通常的看法相反,从基层工程师到高层管理者,谷歌的员工都真心致力于做正确的事情。经常被嘲讽的口号“不作恶”实际上是当时

#前端
2024 年初的大语言模型编程实践

原文:LLMs and Programming in the first days of 2024首先我要明确,这篇文章并不旨在回顾大语言模型。显而易见,2023 年对人工智能来说是不平凡的一年,再去强调这一点似乎没有多大必要。这篇文章更多是作为一位程序员的个人体验分享。自从 ChatGPT 出现,再到使用本地运行的大语言模型,我就开始广泛应用这项新技术。我的目标不仅仅是提高编码效率,更重要的是,

文章图片
#语言模型#人工智能#自然语言处理
2024 年人工智能指数报告 —— 由斯坦福大学人工智能研究院发布

欢迎来到 2024 年人工智能指数报告欢迎来到人工智能指数报告的第七版。2024 年的指数是我们迄今为止最全面的一次,它出现在一个重要的时刻,当 AI 对社会的影响从未如此明显。今年,我们扩大了范围,更广泛地覆盖了诸如 AI 技术进步、公众对技术的看法以及围绕其发展的地缘政治动态等基本趋势。这一版包含了比以往任何时候都多的原始数据,引入了关于 AI 培训成本的新估计、负责任的 AI 领域的详细分析

#人工智能
使用大语言模型 (LLMs) 构建产品一年后的经验总结 (第一部分) [译]

想直接听作者们讨论这个话题,请报名参加 6 月 20 日的即将举行的虚拟活动(链接在文末),并了解更多 6 月 12 日的生成式 AI 成功案例超级流(链接在文末,后续本公众号会翻译提供)。本系列的第二部分和第三部分即将推出,敬请期待。现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中,LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度,加上社交媒..

#语言模型#人工智能#自然语言处理
Zed——全球最快AI代码编辑器来了!

启用/禁用文件编辑、终端命令、语言服务器等权限,甚至创建专属“工具配置文件”!:深度调试器上线、人-AI协作模式升级、Windows稳定版发布!将AI深度集成到代码编辑器中,开源可控、速度极致、隐私无忧!:AI代理工作时,你可继续编码,完成后通过通知查看差异文件。在这里,速度、掌控感与创造力融为一体——而这,只是开始。中输入指令,AI瞬间定位代码库并完成修改,无需等待索引!,让AI连接数据库、自动

#人工智能#编辑器
吴恩达老师 AI 代理工作流程的四种设计模式之一:反思

上周,我描述了 AI 代理工作流程的四种设计模式,我相信它们将在今年推动重大进展:反思、工具使用、规划和多智能体协作。代理工作流不是直接LLM生成最终输出,而是多次提示,LLM使其有机会逐步构建更高质量的输出。在这封信中,我想讨论一下反思。对于实现速度相对较快的设计模式,我已经看到它带来了令人惊讶的性能提升。你可能有过这样的经历:提示 ChatGPT/Claude/Gemini,收到不满意的输出,

#人工智能#设计模式
探索大型语言模型的“思维轨迹“

这些策略被编码在模型生成每个单词所需的数十亿次计算中,即便作为开发者,我们也难以完全理解其内部机制。这种"黑箱"特性意味着,我们至今仍无法完全解释模型完成多数任务的具体方式。我们借鉴神经科学的研究范式,尝试构建"AI显微镜"来观测模型内部的神经活动模式与信息流动。:Claude精通数十种语言,但它的"思维语言"究竟是什么?:模型展示的逐步推理是否真实反映其思考过程?• 激活"已知答案"特征 → 模

#语言模型#人工智能#python +2
探索大型语言模型的“思维轨迹“

这些策略被编码在模型生成每个单词所需的数十亿次计算中,即便作为开发者,我们也难以完全理解其内部机制。这种"黑箱"特性意味着,我们至今仍无法完全解释模型完成多数任务的具体方式。我们借鉴神经科学的研究范式,尝试构建"AI显微镜"来观测模型内部的神经活动模式与信息流动。:Claude精通数十种语言,但它的"思维语言"究竟是什么?:模型展示的逐步推理是否真实反映其思考过程?• 激活"已知答案"特征 → 模

#语言模型#人工智能#python +2
    共 44 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择