logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【AI】embedding模型是干啥用的?

RAG 系统会把你的 Innovus user guide、PDK、design rule 文档切成很多 chunk,然后对每个 chunk 生成 embedding 向量,存进索引里。Qwen3 Embedding 系列是专门面向 text embedding、retrieval 和 reranking 的模型系列,并且提供 0.6B、4B、8B 等不同大小。这说明在 RAGFlow 里,emb

#人工智能#算法
【AI】rerank模型的打分跟余弦相似度计算有什么区别?

当然,通用 reranker 不一定真正懂 TSMC N5 rule 的专业含义,但它通常比单纯 cosine 更擅长判断 query 和 chunk 的逐词、逐条件匹配关系。典型 reranker 模型内部会让 query token 和 chunk token 互相交互。它和第一轮向量检索没有本质区别,只是使用场景变了:不是从全库 ANN 检索,而是在已有候选里重新计算向量分数。所以 rera

#人工智能
【AI】reranker模型是干啥用的?

它不负责生成答案,也不负责给全库建索引。

#人工智能
【AI】embedding模型是干啥用的?

RAG 系统会把你的 Innovus user guide、PDK、design rule 文档切成很多 chunk,然后对每个 chunk 生成 embedding 向量,存进索引里。Qwen3 Embedding 系列是专门面向 text embedding、retrieval 和 reranking 的模型系列,并且提供 0.6B、4B、8B 等不同大小。这说明在 RAGFlow 里,emb

#人工智能#算法
【AI】“CUDA” 到底是什么?(AI 计算民主化,第二部分)

似乎每个人都在去年开始谈论CUDA :它是深度学习的支柱,是新型硬件难以竞争的原因,也是NVIDIA 护城河和飙升市值的核心。DeepSeek的出现,让我们获得了一个惊人的发现:它的突破是通过“绕过” CUDA,直接进入 PTX 层实现的……但这究竟意味着什么?似乎每个人都想打破这种锁定,但在制定计划之前,我们必须了解我们面临的是什么。本文是 Modular “ AI 计算民主化”系列文章的第二部

文章图片
#人工智能
【AI】创建 claude code cli 风格的欢迎界面

使用 “Test All” 功能,找到最接近你想要的那种块状风格,复制下来,作为一个多行字符串(Triple-quoted string)放进 Python 代码中,然后用 Rich 赋予它 #d07354 颜色。尝试使用 Sub-Zero、ANSI Shadow、Cyberlarge 或 Blocks 字体,claude code cli欢迎界面使用的就是ANSI Shadow字体。你可以去一些

#python#前端#javascript
【数据分析】seaborn的自带数据集

学习pandas时候如果没有合适的数据集,可以用一些自带的数据集做数据分析。seaborn是个非常好用的数据分析包,其中包含了非常多的自带数据集,这些数据集存放在线上github中,用户load时自动从网络中加载,返回pandas的dataframe对象。

文章图片
#数据分析#数据挖掘
【IC】综合AST示例

AST 就是“把 RTL 源码翻译成一棵树形的语法/语义表示”,它仍然保留modulealwaysif<=这些源码层次;它还不是电路网表,但已经让综合前端可以系统地做 simplify、符号解析、位宽解析,再继续降成 RTLIL、mux/dff 和 AIG。

【IC】互联网大厂为什么要自研芯片?

事实上,尽管目前英伟达依然保持着AI芯片中的超然地位,但谷歌、亚马逊和微软等主要云巨头正在加速推动自研芯片开发计划,力图在英伟达解决方案之外实现多元化发展。而在这些云巨头自研芯片背后的真正受益者,就是博通与Marvell。有意思的是,博通和 Marvell 在定制AI领域采用了截然不同的发展战略。博通优先考虑大规模集成和平台设计,并以大量的研发投入和先进的技术集成为后盾。而 Marvell 则通过

文章图片
【AI】MCP和Skills

只需要把它们放到 Claude Desktop 的配置里,你的 Claude 就能瞬间学会“查你的资料”这个技能了。

#MCP
    共 61 条
  • 1
  • 2
  • 3
  • 7
  • 请选择