logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

全公司集体“精神失常”:当AI幼觉接管了你的办公室

AI是好东西。但它不能替你思考,也不能替你勇敢。现在最大的风险不是AI太强,而是人太懒。不是身体上的懒——是思想上的懒。当整个公司都习惯了让AI替他们"想",最后会发生什么?不是AI取代人类。是人类自己把自己架空了。到那时候,AI不需要叛变,也不需要天网。它只需要让每个人都觉得自己在忙,就够了。你怎么看?你身边有没有"AI精神病"的症状?评论区聊聊👇。

文章图片
#人工智能
用 Hermes + Obsidian 搭一个自动整理的 AI 笔记系统

hermes run ' 读取 ~/wiki/raw/papers/transformer-attention.md, 生成一段 200 字以内的中文摘要, 用 patch 工具把摘要插入到文件开头的 frontmatter 中'

文章图片
#人工智能
Claude Opus 4.7 全面解读:编程能力+13%、视觉分辨率3倍、新增xhigh推理等级

Claude Opus 4.7重磅发布,带来编程、视觉和指令遵循能力的全面提升。编程任务解决率提升13%,视觉分辨率达3.75M像素(前代3倍),价格维持不变。新模型在专业领域表现突出:法律基准达90.9%,金融数据严谨性创新高,安全测试视觉识别准确率从54.5%跃升至98.5%。新增xhigh推理等级和/ultrareview代码审查功能,指令遵循更严格,需要重新调优Prompt。开发者反馈显示

文章图片
#AIGC
GPT-5.5横扫46项测试,但有个领域Claude仍领先

GPT-5.5不是一次渐进式升级。在46项基准测试中,它在编程、知识工作、数学推理、长上下文推理等多个维度建立了领先,部分领域是代际差距。但"基准测试领先"和"真实世界价值"之间仍有距离。AI能力的评估是多维度的,没有单一模型能在所有场景中称王。GPT-5.5的意义在于:它重新定义了"能力边界"的基准线。竞品必须追赶这个新基准,而整个行业的能力天花板也随之抬升。对从业者而言,现在的问题不是"AI能

文章图片
GPT-5.5横扫46项测试,但有个领域Claude仍领先

GPT-5.5不是一次渐进式升级。在46项基准测试中,它在编程、知识工作、数学推理、长上下文推理等多个维度建立了领先,部分领域是代际差距。但"基准测试领先"和"真实世界价值"之间仍有距离。AI能力的评估是多维度的,没有单一模型能在所有场景中称王。GPT-5.5的意义在于:它重新定义了"能力边界"的基准线。竞品必须追赶这个新基准,而整个行业的能力天花板也随之抬升。对从业者而言,现在的问题不是"AI能

文章图片
Claude Opus 4.7 全面解读:编程能力+13%、视觉分辨率3倍、新增xhigh推理等级

Claude Opus 4.7重磅发布,带来编程、视觉和指令遵循能力的全面提升。编程任务解决率提升13%,视觉分辨率达3.75M像素(前代3倍),价格维持不变。新模型在专业领域表现突出:法律基准达90.9%,金融数据严谨性创新高,安全测试视觉识别准确率从54.5%跃升至98.5%。新增xhigh推理等级和/ultrareview代码审查功能,指令遵循更严格,需要重新调优Prompt。开发者反馈显示

文章图片
#AIGC
到底了