子綦个人主页

@VeritasCN

子綦

2022-11-18 08:59:33 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【学习方法实践分享】Andrej Karpathy 推荐的阅读方法实践：我是如何结合“沉浸式翻译”啃动英文顶会论文的？（附 Prompt 模板）

作为一名普通工程师，面对海量的英文技术论文（尤其是像 NeurIPS, ICLR 这种顶会，或者 OpenRouter 上那些硬核的技术博客），我过去常常面临三大痛点：直到 2025年11月18日，AI 大神 Andrej Karpathy（OpenAI 联合创始人/前 Tesla AI 总监）分享了他最新的 “AI 辅助读书法”，彻底改变了我的认知。他提出了一个反直觉的观点：不要把书直接扔给 A

#人工智能 #学习方法 #经验分享

【学习方法实践分享】Andrej Karpathy 推荐的阅读方法实践：我是如何结合“沉浸式翻译”啃动英文顶会论文的？（附 Prompt 模板）

语言障碍：满屏的长难句和专业术语，读两行就想睡觉。理解极浅：用翻译软件看完，只知道“大概干了啥”，却不懂“为啥这么干”以及“本质是什么”。过目即忘：没有深度的思考交互，读完一周后就忘得干干净净。直到2025年11月18日，AI 大神（OpenAI 联合创始人/前 Tesla AI 总监）分享了他最新的“AI 辅助读书法”，彻底改变了我的认知。不要把书直接扔给 AI 就不管了Manual Read（

#人工智能 #学习方法 #经验分享

【DeepSeek-OCR】光学Token：长上下文建模的范式转变

DeepSeek-OCR提出了一种革命性的长上下文建模方法，通过将文本转化为视觉图像进行压缩处理，突破传统Transformer的二次方计算瓶颈。该技术将长文本渲染为图像，经视觉编码器提炼为少量"光学Token"，使4096个文本Token可压缩至256个光学Token，大幅降低计算量。这种范式转变从信息表示形式入手，而非优化处理算法，为AI长期记忆、代码处理等领域开辟新路径，

#语言模型 #计算机视觉 #人工智能 +2

Keras：Conv1D

keras.layers.Conv1D(filters, kernel_size, strides=1, padding='valid', data_format='channels_last', dilation_rate=1, activation=None, use_bias=True, kernel_initializer='glorot_uniform', bias_initializ.

到底了