logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

通俗理解Deepseek V4中的CSA & HCA 注意力机制

*传统全注意力**就像走进一座巨型图书馆,管理员要求你**逐本翻开每一本书的每一页**,来确定这本书是不是你要的。V4模型做了一件很有意思的事,它设计出**CSA(压缩稀疏注意力)和HCA(重度压缩注意力)**,用人类“偷懒”的智慧,把计算量砍掉了一大截,同时还不耽误正事。交流次数断崖式下跌,信息传递却依然有效。| **核心策略** | 全部计算,一个不漏 | 先压缩,再稀疏关注 | 极度压缩,只

#人工智能
(转载)TRAE、Qoder、CodeBuddy 究竟谁更好用

这个视频评测不错,我自己也在用TRAE,的确TRAE目前最好用,综合来说。(转载)TRAE、Qoder、CodeBuddy 究竟谁更好用。

#人工智能
deepseek R1的确不错,特别是深度思考模式

是算法组在ICU病房陪护时写的"优化父亲化疗方案路径规划",是前端妹子产房里提交的"紧急修复支付页面兼容性BUG",是架构师边带孩子打退烧针边画的分布式系统脑图...这些没有写在OKR里的史诗级操作,才是我们对抗世界的真实补丁。当Ctrl+S的肌肉记忆遇上抢票插件,当Spring Boot的启动动画撞上春运倒计时,我们知道——该给2024的Jira画上最后一个燃尽点了。- 那个偷偷用GPT-5生成

文章图片
一个简单的羊毛claude-4.6最新版本的方法

这个网站只能支持上传PDF,那么比如你有很多程序文件,假设放在某个文件夹下,则可以编写这一个PYTHO程序,运行后,把你的所有某个文件夹下的文件,每个内容都放到一个PDF中去,因为网站只支持每个PDF90页内,所以呢,你的文件多的话,则可以用这个程序,自动分卷为多个PDF,再上传到这个网站,就可以自动帮你分析你这些PDF里面的内容了,就等于你把你的很多个程序文件都上传到这个网站,可以羊毛claud

#AI
deepseek R1的确不错,特别是深度思考模式

是算法组在ICU病房陪护时写的"优化父亲化疗方案路径规划",是前端妹子产房里提交的"紧急修复支付页面兼容性BUG",是架构师边带孩子打退烧针边画的分布式系统脑图...这些没有写在OKR里的史诗级操作,才是我们对抗世界的真实补丁。当Ctrl+S的肌肉记忆遇上抢票插件,当Spring Boot的启动动画撞上春运倒计时,我们知道——该给2024的Jira画上最后一个燃尽点了。- 那个偷偷用GPT-5生成

文章图片
一个简单的羊毛claude-4.6最新版本的方法

这个网站只能支持上传PDF,那么比如你有很多程序文件,假设放在某个文件夹下,则可以编写这一个PYTHO程序,运行后,把你的所有某个文件夹下的文件,每个内容都放到一个PDF中去,因为网站只支持每个PDF90页内,所以呢,你的文件多的话,则可以用这个程序,自动分卷为多个PDF,再上传到这个网站,就可以自动帮你分析你这些PDF里面的内容了,就等于你把你的很多个程序文件都上传到这个网站,可以羊毛claud

#AI
通俗理解Deepseek V4中的CSA & HCA 注意力机制

*传统全注意力**就像走进一座巨型图书馆,管理员要求你**逐本翻开每一本书的每一页**,来确定这本书是不是你要的。V4模型做了一件很有意思的事,它设计出**CSA(压缩稀疏注意力)和HCA(重度压缩注意力)**,用人类“偷懒”的智慧,把计算量砍掉了一大截,同时还不耽误正事。交流次数断崖式下跌,信息传递却依然有效。| **核心策略** | 全部计算,一个不漏 | 先压缩,再稀疏关注 | 极度压缩,只

#人工智能
(转载)TRAE、Qoder、CodeBuddy 究竟谁更好用

这个视频评测不错,我自己也在用TRAE,的确TRAE目前最好用,综合来说。(转载)TRAE、Qoder、CodeBuddy 究竟谁更好用。

#人工智能
收藏:一个不错的讲解LLM到skills各个概念的视频

从 LLM 到 Agent Skill,一期视频带你打通底层逻辑!

一个简单的羊毛claude-4.6最新版本的方法

这个网站只能支持上传PDF,那么比如你有很多程序文件,假设放在某个文件夹下,则可以编写这一个PYTHO程序,运行后,把你的所有某个文件夹下的文件,每个内容都放到一个PDF中去,因为网站只支持每个PDF90页内,所以呢,你的文件多的话,则可以用这个程序,自动分卷为多个PDF,再上传到这个网站,就可以自动帮你分析你这些PDF里面的内容了,就等于你把你的很多个程序文件都上传到这个网站,可以羊毛claud

#AI
    共 118 条
  • 1
  • 2
  • 3
  • 12
  • 请选择