logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【学习方法实践分享】Andrej Karpathy 推荐的阅读方法实践:我是如何结合“沉浸式翻译”啃动英文顶会论文的?(附 Prompt 模板)

作为一名普通工程师,面对海量的英文技术论文(尤其是像 NeurIPS, ICLR 这种顶会,或者 OpenRouter 上那些硬核的技术博客),我过去常常面临三大痛点:直到 2025年11月18日,AI 大神 Andrej Karpathy(OpenAI 联合创始人/前 Tesla AI 总监)分享了他最新的 “AI 辅助读书法”,彻底改变了我的认知。他提出了一个反直觉的观点:不要把书直接扔给 A

文章图片
#人工智能#学习方法#经验分享
【学习方法实践分享】Andrej Karpathy 推荐的阅读方法实践:我是如何结合“沉浸式翻译”啃动英文顶会论文的?(附 Prompt 模板)

语言障碍:满屏的长难句和专业术语,读两行就想睡觉。理解极浅:用翻译软件看完,只知道“大概干了啥”,却不懂“为啥这么干”以及“本质是什么”。过目即忘:没有深度的思考交互,读完一周后就忘得干干净净。直到2025年11月18日,AI 大神(OpenAI 联合创始人/前 Tesla AI 总监)分享了他最新的“AI 辅助读书法”,彻底改变了我的认知。不要把书直接扔给 AI 就不管了Manual Read(

#人工智能#学习方法#经验分享
【DeepSeek-OCR】光学Token:长上下文建模的范式转变

DeepSeek-OCR提出了一种革命性的长上下文建模方法,通过将文本转化为视觉图像进行压缩处理,突破传统Transformer的二次方计算瓶颈。该技术将长文本渲染为图像,经视觉编码器提炼为少量"光学Token",使4096个文本Token可压缩至256个光学Token,大幅降低计算量。这种范式转变从信息表示形式入手,而非优化处理算法,为AI长期记忆、代码处理等领域开辟新路径,

#语言模型#计算机视觉#人工智能 +2
Keras:Conv1D

keras.layers.Conv1D(filters, kernel_size, strides=1, padding='valid', data_format='channels_last', dilation_rate=1, activation=None, use_bias=True, kernel_initializer='glorot_uniform', bias_initializ.

到底了