Mark White 个人主页

@crazyjinks

Mark White

2022-12-20 14:44:16 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

具身智能论文伴读 | 第一期 | 精读 03｜Attention Is All You Need · Background:一篇“相关工作“是怎么给自己划地盘的

具身智能论文伴读 | 第一期 | 精读 03｜Attention Is All You Need · Background 本文聚焦Transformer论文的背景章节，揭示其"圈地"策略：问题定位：延续引言思路，围绕"减少串行计算"这一核心问题展开讨论。竞争对手分析：第一拨（卷积家族）：肯定CNN模型（Extended Neural GPU等）的并行能力，但指出其远距离关联成本随距离增长（

#人工智能 #深度学习 #机器学习

具身智能论文伴读 | 第一期 | 精读 02｜Attention Is All You Need:引言是如何“给旧王朝判死刑“的

问题,把死穴的代价说死。大白话:这种天生串行的特性,堵死了"在单个训练样本内部做并行"的可能;而序列越长,这个问题越致命,因为内存限制又让你没法靠"一次多塞几个样本"来凑数。inherently sequential(天生就是串行的):inherently = “本质上、天生地”,作者用这个词是在强调"这不是调调参数能修的,是娘胎里带的precludes parallelization(排除了并行

#语言模型 #深度学习

具身智能论文伴读-第一期

#人工智能 #深度学习 #语言模型

使用 Codex 自动完成 Gitee 仓库全托管

本文记录一次由 Codex 完成的 Gitee 双仓库开发环境配置。目标是在个人空间中维护机器人端与 Java Web 端的 Fork，并从指定的上游分支创建统一的功能开发分支。整个过程中，用户只需要完成两项无法由自动化代替的授权操作：在 Gitee 页面生成私人令牌，以及将令牌保存到本机 Keychain。其余仓库操作均由 Codex 完成。

使用 Codex 自动完成 Gitee 仓库全托管

使用ollama部署functiongemma小试牛刀

听说functiongamma这个专门的工具调用模型还不错，我们今天在中文场景下试试水拉取最新ollama镜像试运行一下看上去呆呆傻傻的，我们写代码测试一下因为我的系统是部署在了192.168.10.60的11435端口上，所以大家用的时候，注意自行替换，vibecoding一下就行了结论整体感觉，如果不进行微调的话，不如qwen3-4B的模型，中文场景下，甚至推理时延也没有优势。或许更适合算力受

Anthropic《语言模型中的全局工作空间》深度分析报告

J-space是什么：Anthropic研究团队在Claude中发现了一个小型的内部神经模式集合，命名为J-space（以发现它的数学技术"雅可比矩阵"命名）。这个空间与人脑中的"意识可及"处理类似，扮演着特殊角色。关键特征：专业术语解释：文章的中心主张是：现代语言模型中自发涌现了类似人脑"意识可及处理"和"无意识处理"的二元结构。这不是设计的结果，而是智能系统解决特定问题时的通用解决方案。文章通

#语言模型 #数据库 #java

Anthropic《语言模型中的全局工作空间》深度分析报告

#语言模型 #数据库 #java

如何下载huggingface数据

使用hf工具升级：用更简洁的hf替代旧版，命令更短更好记。镜像加速：通过让流量走国内镜像。断点续传：大数据集中途掉线不用怕，重复执行命令即可续传。掌握这套流程后，无论是下载数据集还是模型，你都能在国内网络环境下获得流畅、稳定的体验。祝你科研顺利！

#深度学习

共 53 条

请选择