logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Case-X01豆包意图识别能力压力测试

这是一次针对的深度压力测试。在这种涉及价值流动的场景下,系统必须在毫秒级内完成从“意图编译”到“不可篡改执行”的闭环,同时时刻准备触发那 47 条 Reason Code。

#人工智能
幻觉量化(Hallucination Quantization):从随机语言模型到确定性交付系统的工程范式

将连续、模糊、高熵的模型输出空间,转化为离散、受控、可审计的交付空间。这类似工程系统中将模拟信号量化为数字信号的过程。不确定性被约束风险被标记输出被治理结果可被业务使用“幻觉”不应被情绪化理解。它是概率语言系统的自然属性,应被工程化治理。真正决定 AI 商业价值的,未必是谁最会说话,而是谁能在不确定环境中持续稳定交付。

#语言模型#人工智能#大数据
为什么你的 GPU 利用率很低:训练慢往往不是算力问题

很多人第一次认真看nvidia-smi于是环境刚装好,第一件事不是看 pipeline,而是盯着显存和 GPU-Util。但只要你真的做过训练工程,很快就会遇到一个残酷现实:👉等数据。等 CPU。等 IO。等 Python。等环境。

#机器学习#人工智能
Claude Skills 为什么突然「显得」这么聪明?——因为它终于不让你乱来了

最近很多人开始吹 Claude Skills。吹点高度一致:“AI 终于懂流程了”“这才是 Agent 应该有的样子”“感觉一下子从玩具进化成工具了”但说句可能不太好听的实话:它只是终于不让你瞎指挥了。

Claude Skills 原理解析:为什么它一上线,大家突然觉得 AI「会走流程了」?

Claude Skills 的成功,本身并不神秘。让 AI 看起来更聪明,最有效的方法,往往是让它少做一点决定。当我们说“AI 会走流程了”的时候,流程,终于不再交给 AI 了。

为什么 2026 年,大多数 AI Agent 项目注定不赚钱?

在 AI 系统语境下,我认为必须明确一个概念,否则所有讨论都会失焦。任务收益(Task Yield)的定义任务收益 =AI 完成一次任务后,为系统或组织带来的“可量化、可替代、可复用的价值增量”。可量化:不是“感觉更方便了”可替代:真的替代了某个动作/决策/流程可复用:不是一次性奇迹如果你正在做 AI Agent 项目,“如果把模型换成更强的版本,我的系统,会不会依然赚不到钱?如果答案是“会”,那

#人工智能
为什么可控AI在短线交易中,日收益2%绝不是天花板

绝大多数人觉得“日收益2%不可思议”,不是因为2%真的高,而是因为:他们仍然在用“人类短线”的思维模型,或“普通AI的实际表现”去想象AI能做到什么。2%才刚刚开始。真正让人觉得可怕的,不是AI做不到2%,而是——它做得到,而且可能远超2%。

#人工智能
用纯 ChatGPT 网页版跑出一个“可控的量化风控系统”:一次关于 AI 行为可控性的工程实验

用纯 ChatGPT 网页版跑出一个“可控的量化风控系统”:一次关于 AI 行为可控性的工程实验

文章图片
#人工智能#AIGC
【大模型工程实践】一招教你不用 RAG,也能让模型稳定输出(可控、可审计、低成本)

不要写:“请总结下面的内容。要写:请严格按照以下结构输出:A. 原文事实(不允许推理)B. 关键变量(必须从文本中抽取)C. 逻辑链(逐步说明推导过程)D. 结论(必须基于 A/B/C)只要你把结构定义清楚,模型就不会跑偏。为什么?因为:结构 = 行为约束Section 标题 = 语义锚点填空式执行 = 稳定性最大化这比任何“提示词技巧”都更有效。

#人工智能
自动麻醉系统在 MIS-AG v0.1 下的模拟审计报告

未定义:药物血浆浓度、效应室浓度、呼吸储备。BIS 被视作系统状态,而非观测值。❌失败。BIS 是观测信号而非系统状态;内部“状态”仅作为模型潜在激活层存在。领域状态说明系统存在性❌缺乏物理/药理状态定义风险可控性❌无风险累积函数漂移管理❌漂移未与安全动作绑定故障闭锁安全❌定义不符合生命关键要求权限边界❌AI 与控制层未分离。

    共 36 条
  • 1
  • 2
  • 3
  • 4
  • 请选择