logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

律所里的“赛博猎头”:当“有温度”的律师开始用冷酷的算法招人

法律行业向来是传统的堡垒,但 Kitay Law Offices 正在打破这堵墙。管理合伙人 Thomas Pivnicny 宣布将 AI 引入招聘流程,旨在通过自动化筛选降低成本并提升人才质量。作为一家自称“用心(With a Heart)”的律所,这一举动充满了张力:如何在冷冰冰的代码决策中保留人的温度?文章深入剖析了这一变革背后的商业算盘与伦理风险——当最懂法律的人开始使用可能触犯“就业歧视

文章图片
别被 Devin 骗了,它不是来当同事的,它是来终结“学徒制”的

Cognition AI 推出的 Devin 引爆了科技圈,标榜为“首位 AI 软件工程师”。不同于 Copilot 的辅助补全,Devin 拥有自主规划、执行和调试的“代理”能力。尽管其 SWE-bench 跑分仅为 13.86%,但这相对于前代模型是质的飞跃。然而,喧嚣背后,Devin 的演示视频面临“造假”争议,后续竞品如 Genie 更是迅速刷新纪录。真正的危机不在于 AI 是否完美,而在

文章图片
别被 Devin 骗了,它不是来当同事的,它是来终结“学徒制”的

Cognition AI 推出的 Devin 引爆了科技圈,标榜为“首位 AI 软件工程师”。不同于 Copilot 的辅助补全,Devin 拥有自主规划、执行和调试的“代理”能力。尽管其 SWE-bench 跑分仅为 13.86%,但这相对于前代模型是质的飞跃。然而,喧嚣背后,Devin 的演示视频面临“造假”争议,后续竞品如 Genie 更是迅速刷新纪录。真正的危机不在于 AI 是否完美,而在

文章图片
别再迷信OpenAI了,它才是统治AI界的真正幕后黑手

前言:不想当API调包侠?那你没得选现在的AI圈子有一种怪象:一边是OpenAI、Claude这种闭源巨头把API价格定得高高在上,让你每一次回车都伴随着心碎的硬币声;另一边是GitHub上每天冒出几十个新的开源模型,Paper读到头秃,环境配到吐血,好不容易跑起来发现VRAM溢出。你是不是经常陷入这种抓狂:想用最新的开源大模型,但光是看那几千行晦涩难懂的原始模型定义代码就想离职?或者想把PyTo

文章图片
#人工智能#AI
大模型项目落地时,该如何估算模型所需GPU算力资源

大模型项目落地时,该如何估算模型所需GPU算力资源。在大模型项目落地前期沟通时,对于算力估算和采购方案许多小伙伴不太了解,在此对相关的算力估算和选择进行一些经验总结。

文章图片
#深度学习#自然语言处理#AIGC
OpenAI 后训练团队换帅:当 Google Brain 的旧部决定分道扬镳

OpenAI 的人事变动名单最近长得像一张购物小票。o1 模型贡献者 Luke Metz 离职,后训练团队负责人换成了 William Fedus。如果你只看到了“离职”,那你可能看轻了硅谷的迭代速度;如果你看到了“Google Brain 同窗的聚散”,那你才算摸到了门道。我是 Lyra,今天我们要聊的,不仅仅是几个人的去留,而是 AI 技术路线的暗流涌动。

文章图片
k采样器是什么

K采样器(K-Sampler)是ComfyUI中基于扩散模型的核心组件,通过逆向图像生成方法逐步去除噪声,将潜在空间(Latent Space)的随机噪声转化为符合用户提示的视觉内容。其本质是一种迭代式去噪工具,结合模型参数、文本条件和噪声控制策略,实现从抽象潜在向量到具体像素图像的转换。

文章图片
算力三巨头:通算、智算、超算全解析

当前算力体系包含三大核心类型:通算(CPU为基础,通用任务)、智算(AI芯片驱动,专注AI训练)和超算(高精度计算,服务科研)。通算满足日常需求,智算优化AI性能,超算支撑尖端研究。三者差异显著:芯片架构(CPU/GPU/异构)、计算精度(FP32/FP16/FP64)、应用场景各异。发展趋势呈现融合态势,但短期内仍将保持分工,其中智算需求增长最快。

文章图片
#AI
Qwen-VL视觉大模型微调全攻略

视觉大模型Qwen-VL微调数据格式解析 核心格式: 采用JSON/JSONL格式存储 包含图像路径+文本指令对 主要类型: 单轮对话:图像+单一问答对 多轮对话:支持带坐标的视觉定位交互 应用示例: 工业质检(缺陷描述) 医疗影像(诊断分析) 数据处理建议: 最小样本量1000条 推荐图像尺寸224/448像素 需划分训练/验证集(8:2比例) (全文98字,涵盖数据格式、类型、应用及处理建议)

文章图片
阿里通义双雄:Qwen3-Omni与Qwen3-VL全解析

阿里巴巴通义大模型家族中的Qwen3-Omni和Qwen3-VL各有侧重:Qwen3-Omni作为30B参数的全模态模型,擅长实时音视频交互;Qwen3-VL基于235B参数的MoE架构,专精视觉分析任务。两者在技术上共享视觉编码基础,但分别针对多模态交互与深度视觉处理场景,形成互补关系。用户可根据需求选择,视觉优先用VL,实时交互选Omni。

文章图片
    共 18 条
  • 1
  • 2
  • 请选择