这就是编程个人主页

@cq20110310

这就是编程

2023-04-09 12:14:59 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

全新DeepSeek V3-0324发布：人工智能搜索的新突破

例如，在“动态天气卡片”测试中，新版V3生成的代码逻辑完整性与可执行性远超R1版本。，结合强化学习驱动的自我验证机制，显著降低训练成本（初代V3仅耗资557.6万美元即实现媲美Claude 3.5的性能）。：发布数小时内，衍生出23个垂直领域微调模型（如医疗问答、法律文书生成），形成“模型雨林”生态。：针对开发者呼声最高的编程与对话体验优化，此次升级为R2的“全模态能力”埋下伏笔。：企业用户反馈，

#人工智能

LLM Tech Map 大模型技术图谱

分享一个LLM Tech Map 大模型技术图谱从基础设施、大模型、Agent、AI 编程、工具和平台，以及算力几个方面，为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。核心价值：帮助技术人快速了解 LLM 的核心技术和关键方向。...

回望我在谷歌的 18 年 [译]

今天这篇谷歌员工写的“Reflecting on 18 years at Google”很火，翻译过来给大家欣赏一下我于 2005 年 10 月加入谷歌，18 年后，我递交了辞呈。上周，我结束了在谷歌的最后一段日子。对于能够亲历谷歌上市初期的时光，我感到非常幸运；不同于大多数公司，与通常的看法相反，从基层工程师到高层管理者，谷歌的员工都真心致力于做正确的事情。经常被嘲讽的口号“不作恶”实际上是当时

#前端

2024 年初的大语言模型编程实践

原文：LLMs and Programming in the first days of 2024首先我要明确，这篇文章并不旨在回顾大语言模型。显而易见，2023 年对人工智能来说是不平凡的一年，再去强调这一点似乎没有多大必要。这篇文章更多是作为一位程序员的个人体验分享。自从 ChatGPT 出现，再到使用本地运行的大语言模型，我就开始广泛应用这项新技术。我的目标不仅仅是提高编码效率，更重要的是，

#语言模型 #人工智能 #自然语言处理

2024 年人工智能指数报告 —— 由斯坦福大学人工智能研究院发布

欢迎来到 2024 年人工智能指数报告欢迎来到人工智能指数报告的第七版。2024 年的指数是我们迄今为止最全面的一次，它出现在一个重要的时刻，当 AI 对社会的影响从未如此明显。今年，我们扩大了范围，更广泛地覆盖了诸如 AI 技术进步、公众对技术的看法以及围绕其发展的地缘政治动态等基本趋势。这一版包含了比以往任何时候都多的原始数据，引入了关于 AI 培训成本的新估计、负责任的 AI 领域的详细分析

#人工智能

使用大语言模型 (LLMs) 构建产品一年后的经验总结 (第一部分) [译]

想直接听作者们讨论这个话题，请报名参加 6 月 20 日的即将举行的虚拟活动（链接在文末），并了解更多 6 月 12 日的生成式 AI 成功案例超级流（链接在文末，后续本公众号会翻译提供）。本系列的第二部分和第三部分即将推出，敬请期待。现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中，LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度，加上社交媒..

#语言模型 #人工智能 #自然语言处理

Zed——全球最快AI代码编辑器来了！

启用/禁用文件编辑、终端命令、语言服务器等权限，甚至创建专属“工具配置文件”！：深度调试器上线、人-AI协作模式升级、Windows稳定版发布！将AI深度集成到代码编辑器中，开源可控、速度极致、隐私无忧！：AI代理工作时，你可继续编码，完成后通过通知查看差异文件。在这里，速度、掌控感与创造力融为一体——而这，只是开始。中输入指令，AI瞬间定位代码库并完成修改，无需等待索引！，让AI连接数据库、自动

#人工智能 #编辑器

吴恩达老师 AI 代理工作流程的四种设计模式之一：反思

上周，我描述了 AI 代理工作流程的四种设计模式，我相信它们将在今年推动重大进展：反思、工具使用、规划和多智能体协作。代理工作流不是直接LLM生成最终输出，而是多次提示，LLM使其有机会逐步构建更高质量的输出。在这封信中，我想讨论一下反思。对于实现速度相对较快的设计模式，我已经看到它带来了令人惊讶的性能提升。你可能有过这样的经历：提示 ChatGPT/Claude/Gemini，收到不满意的输出，

#人工智能 #设计模式

探索大型语言模型的“思维轨迹“

这些策略被编码在模型生成每个单词所需的数十亿次计算中，即便作为开发者，我们也难以完全理解其内部机制。这种"黑箱"特性意味着，我们至今仍无法完全解释模型完成多数任务的具体方式。我们借鉴神经科学的研究范式，尝试构建"AI显微镜"来观测模型内部的神经活动模式与信息流动。：Claude精通数十种语言，但它的"思维语言"究竟是什么？：模型展示的逐步推理是否真实反映其思考过程？• 激活"已知答案"特征 → 模

#语言模型 #人工智能 #python +2

探索大型语言模型的“思维轨迹“

#语言模型 #人工智能 #python +2

共 44 条

请选择