
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
LangChain 团队对 Andrej Karpathy 的表述进行改写,他曾帮助打造特斯拉的人工智能并共同创建 OpenAI:“LLMs 就像一种新型操作系统。LLM 是 CPU,上下文窗口是 RAM。我找到了一个更简单的方式来向我的营销朋友解释,他们对“tokens”和“推理”感到困惑。你的 AI 是一名员工。上下文窗口是他们的桌子。[…] 你给他们的提示词是今早递给他们的便签。你的 AI

上个月的讲述了 STM32"蓝色药丸"微控制器板如何被用来"捕获"数据,这些数据随后被用于在 Jupyter 笔记本中运行的 Python TensorFlow 过程训练机器学习模型。最初的希望是该模型可以在 STM32 本身上运行,以对"新数据"进行"预测"或"推断"。相反,更小但更强大的 ESP32-C6 小板运行应用程序。训练数据是在蓝色药丸上收集的,在 Jupyter 笔记本中训练的,然后
可以自定义好几样东西。例如,你可以更改智能体的个性、推理努力程度、它使用的终端(本地、Docker等)、记忆设置,以及文本转语音和语音转文本功能等等。大多数这些都可以通过更改文件来配置。

两年来,“AI 代理"的主导形象一直是一个里面装着聪明循环的聊天窗口。你输入目标,代理调用一些工具,你看着 token 流式输出,当工作耗尽耐心或上下文窗口填满时你停止观看。这个范式带我们走了很远,但它有天花板。模型会遗忘。它在任务还没完成时就宣称"任务完成”。它会重新引入九个回合前修复过的 bug。整个结构围绕单次会话而建。长时间运行的代理是下一步。

你害怕失去工作吗?这个问题乍听起来可能很傻,但在过去几年里,失去工作的恐惧已经上升到了恐怖电影跳吓的程度。不只是你。每个有工作的人都极其害怕失去它。我每天都能听到这个,在我文章的评论中,在我的咨询工作中,在社交媒体上,甚至在朋友之间。没有人能幸免。为什么?原因有很多,但一个原因可能是大科技公司和媒体持续不断的灌输,两者在过去四年中花了很多时间告诉我们 AI 要来抢我们的工作了,而且有了这种新型的僵

我认识的大多数技术人都太聪明了,不该只为别人工作。然而,如何将技术技能转化为朝九晚五之外的收入并不总是显而易见的。在这篇文章中,我将拆解 5 个技术专业人士今天就可以开始的副业,以多元化他们的收入。

我厌倦了手动决定使用哪个本地 LLM。编程问题?加载 Qwen。数学问题?切换到推理模型。一般问题?回到更小更快的模型。每次切换都意味着等待 30-60 秒让模型加载到 VRAM 中。这让人精疲力尽。所以我构建了一个自动完成这些的路由器——在不到 5ms 内对每个查询进行分类,并根据基准分数、历史性能和用户反馈将其路由到最优模型。这是关于它如何工作的故事,什么没起作用,以及最让我惊讶的是什么。

许多人对人工智能(AI)和机器学习(ML)感到困惑,通常认为它们是相同的,但事实并非如此。AI 是一个更广泛的领域,专注于构建能够智能行为的系统,而 ML 是 AI 的一个子集,使系统能够从数据中学习。ML 模型不是被显式编程的,而是在数据上训练以识别模式并做出未来决策。现代系统如大语言模型(LLM)和计算机视觉模型主要由 ML 驱动。然而,AI 不仅限于 ML。其他方法也在业界广泛使用,例如基于

使用语言模型曾经很简单。你加载一个模型,发送一个提示,然后收到一个回复。当大多数应用以文本为中心时,这种方法效果很好。这个假设已不再成立。现代 AI 应用被期望能够理解图像、遵循结构化指令,并跨多个步骤进行推理。这种转变在 Gemma 4 中得到了清晰体现,它将多模态理解、长上下文交互和推理能力集中在一个模型家族中。是一个包含多种尺寸的模型家族,有助于实际的部署选择。但对开发者来说更重要的是它如何

语音转换基本上就是将一个说话者的语音拿出来,使其听起来像另一个人——同时保持原始内容不变。它有广泛的应用场景,从AI配音和虚拟YouTuber到个性化语音生成。但在实践中,事情并不总是那么完美。传统方法通常在处理未见过的说话者时会遇到困难,而且它们并不总是能很好地将说话者身份与实际内容分离——这可能导致不自然或混合的结果。这就是为什么零样本语音转换是一个如此重要的想法。与其为每个说话者训练一个模型








