登录社区云,与社区用户共同成长
邀请您加入社区
本文分析了昇腾NPU的三级存储架构及其内存管理策略。NPU采用HBM、L2 Cache和L1 Cache三级存储体系,各级在容量、带宽和延迟上差异显著。数据搬运开销往往超过计算开销,因此需要优化内存管理。文章比较了静态分配和动态分配的优缺点,并详细介绍了内存池化技术,包括预分配策略、分配/释放机制以及碎片合并方法。内存池通过预分配大块内存、复用空闲块和合并相邻块来提升内存利用率,适用于需要确定性延
OpenHarmony远程浏览器控制方案 摘要:本文介绍了如何在OpenHarmony移动设备上通过puppeteer库实现远程浏览器控制功能。由于移动端无法直接运行Chrome,采用Client-Server模式:在PC/云端运行Chrome并开启远程调试端口,OpenHarmony应用通过WebSocket连接进行控制。文章详细讲解了环境配置、核心API使用(包括远程连接、截图和PDF生成)以
摘要:html2pdf-chrome是一个基于Go语言开发的HTML转PDF工具,通过Chrome Headless和CDP协议实现高效转换。该工具解决了传统方案如Puppeteer、wkhtmltopdf等的局限性,支持现代CSS和Canvas渲染。核心特性包括连接池设计实现实例复用、多种等待策略确保页面完整加载,以及CLI/HTTP/Go库三种使用模式。文章详细介绍了技术实现原理、连接池管理机
ChatGPT Atlas是OpenAI于2025年10月发布的AI浏览器,基于Chromium,内置ChatGPT侧边栏实现网页理解、信息提取、文本处理。Agent Mode支持Plus/Pro/Business用户,可执行旅行研究、购物等端到端任务。Atlas与Chrome非竞争关系,而是分工协作:Chrome负责开发调试、银行、生产系统等稳定场景;Atlas负责文档研究、竞品分析、内容整理等
本文主要讲后端联调过程中遇到的典型场景,利用AI编程,通过Chrome插件的形式,解决开发中的痛点问题,来提高前后端联调的效率。
GitNexus是一款AI编程辅助工具,通过自动生成代码知识图谱解决开发痛点。它能一键解析代码库,构建包含函数、类、依赖关系的知识图谱,让AI助手能快速理解代码架构而非逐行读取。主要功能包括:依赖追踪、影响分析、可视化架构图和自动文档生成。相比传统方式可减少59%的Token消耗,提升开发效率。提供GitNexus(全功能)和CodeGraph(轻量版)两种方案,支持主流AI编程工具。安装仅需一行
MCP(Model Context Protocol)服务操作浏览器获取页面 DOM调试网页分析 Network 请求自动执行 DevTools 操作AI + Chrome DevTools 自动化CodexClaudeCursorClineRooCode很多 AI 工具都开始支持 MCP。1. Codex CLI 没安装2. Windows PATH 没配置基本就能正常运行。对于前端开发来说。帮
但是crontab有一个坏毛病,就是它总是不会缺省的从用户profile文件中读取环境变量参数,经常导致在手工执行某个脚本时是成功的,但是到crontab中试图让它定期执行时就是会出错。/etc/profile是全局性的功能,其中设置的变量作用于所有用户,~/.bash_profile中设置的变量能继承/etc/profile中的变量并作用于用户。用户登陆Linux操作系统的时候,"/etc/pr
看启动日志(最简单,30 秒)看显存随 seq_len 的变化(最直观,5 分钟)测延迟随 seq_len 的变化曲线(最准确,30 分钟)用 npu-smi 看 AI Core 利用率(最硬核,需要权限)用 Profiling 工具抓 Timeline(最专业,适合调试)ops-transformer 没编译对(占 80% 的案例),CANN 版本太老(占 15%),head_dim 不支持(占
摘要: Google推出的chrome-devtools-mcp通过MCP协议将Chrome DevTools能力标准化开放给AI编码助手,解决了AI与浏览器间的信息断层问题。该项目基于Puppeteer和CDP协议,提供45个工具覆盖前端调试全场景,包括性能分析、网络监控等核心功能。通过5分钟配置即可实现AI自动完成性能优化闭环,显著提升前端自动化效率。该工具支持主流IDE,标志着前端自动化进入
BrowserOS 并不是简单的 AI 浏览器。AI Agent 平台浏览器自动化系统MCP浏览器中枢本地AI运行环境如果未来 AI 真正开始接管网页操作。那么这类:大概率会成为下一代浏览器方向。
Monknow新标签页插件数据导出工具,支持从Edge/Chrome/Firefox本地存储一键导出书签为HTML格式。该工具包含Python脚本和JS脚本两种方案,自动解析Monknow存储数据并保留分组结构,生成的HTML文件可导入主流浏览器。工具完全本地运行,不修改原始数据,解决了Monknow缺乏官方导出功能的问题。使用方法简单,执行python export-monknow.py即可完成
Fastjson 漏洞是阿里巴巴开源 JSON 库 Fastjson 的反序列化远程代码执行(RCE) 漏洞,核心根源是AutoType 自动类型推断机制设计缺陷,攻击者可构造恶意 JSON,通过@type字段加载恶意类并执行任意代码,自 2017 年起多次爆发高危漏洞,影响极广。当一个类只有一个接口的时候,将这个类的对象序列化的时候,就会将子类抹去(apple/iphone)只保留接口的类型(F
RAID级别最小磁盘数容错能力磁盘空间开销读取速度写入速度硬件成本RAID 02无0%高高低RAID 12单个磁盘50%高低中RAID 53单个磁盘1 / N中低中RAID 64两个磁盘2 / N中低高RAID 104多个磁盘50%高中高RAID 506多个磁盘1 / N高中高RAID 608多个磁盘50%高中高。
本文分享了智能客服RAG项目中的两个关键生产级优化方案。首先针对LLM服务不稳定的问题,设计了Fallback兜底机制,在主模型失败时自动切换备用模型,确保服务连续性。其次解决了知识库同步难题,采用声明式同步思路,实现了新增、更新、删除文件的自动检测与处理,并重点解决了幂等性和同名文件冲突问题。作者指出,RAG项目从Demo到生产环境的真正差距在于工程化能力,包括高可用、数据同步、熔断降级等核心要
本文介绍了如何利用昇腾NPU的算子模板库catlass快速实现自定义稀疏矩阵乘法算子。作者通过实际案例展示了从环境准备到算子开发的完整流程,重点解析了catlass的核心组件:计算核(ComputeUnit)、分块策略(Tile)和流水线编排(Pipeline)。文章详细说明了如何扩展标准GEMM算子,加入mask处理逻辑实现稀疏计算,并提供了关键的性能优化建议,如mask数据的预取策略。相比传统
WSL2环境下AI控制Windows Chrome的调试方案 本文介绍了在WSL2环境中让AI直接控制Windows端Chrome浏览器的解决方案。核心思路是通过Chrome的远程调试功能建立连接,主要步骤包括: 在Windows端启动专用调试版Chrome,指定远程调试端口和非默认用户数据目录 配置WSL2网络环境,确保能访问Windows宿主机的调试端口 使用chrome-devtools-m
AutoFormX 是一款面向开发者和测试人员的 Chrome 插件,通过 AI 自动识别网页表单字段并生成合适的测试数据,支持单字段填写和一键填充整个页面。它适用于注册页测试、后台管理系统联调、产品演示数据填充和表单功能验收等场景,支持 DeepSeek、OpenAI 等多种 AI 服务,旨在减少重复填表工作,提升 Web 测试和表单联调效率。
OpenClaw 的 System Prompt 是一个多层级动态编排系统,将静态协议、六大 Markdown 文件(AGENTS.md、SOUL.md、USER.md、MEMORY.md、IDENTITY.md、TOOLS.md)和实时环境信息拼接为完整指令,赋予 AI 个性化意识与执行能力。系统通过 buildSystemPrompt() 收集材料,buildAgentSystemPrompt
如果有,那么你并不孤单。Prompt Engineering(提示词工程) 已经成了一门学问——如何写出一个好的 Prompt,直接决定了 AI 输出的质量。本文就带你从零开发一个 AI Prompt Enhancer Chrome 浏览器扩展,它能自动识别 AI 网站的输入框,一键增强你的提示词,让输出质量大幅提升。
# GraphQL一种api查询语言,类似sql,用它来查询奈飞的数据库,查找一下和星球大战相关的电影,API地址https://swapi-graphql.netlify.app/.netlify/functions/index。## 3 edge-tts微软 Edge TTS,完全免费、无需 API Key、支持中日韩阿等多语言。## 1 SerpAPI最常见的聚合搜索引擎 https://s
别再自己养龙虾了!实测用一个对话框,白嫖一支 AI 云端战队
上一篇我们聊了 LLM 语义路由,用模型本身做意图分类,告别了关键词硬匹配的三种陷阱。不少同学问:那到底什么时候用关键词、什么时候上 LLM?只用 LLM 不是更香吗?
摘要:本文系统阐述了程序员如何构建"开挂级"技能树,从基础能力、工具效率、高阶思维到实战技巧四个维度展开。基础层强调语言范式、算法思维和计算机原理;工具层聚焦开发工具链、Git和自动化;思维层涵盖设计模式、系统设计和性能优化;实战层则关注代码可读性、调试技巧和系统容错性。文章指出,真正的"开挂"源于系统化学习和持续实践,建议通过开源项目分析、工具复用和跨界融
很多人用 Claude Code 还停留在"帮我写个函数"的阶段,看完 Simon 的指南你会发现,这些工具能做的事情远超你的想象,子 Agent 并行开发、TDD 驱动迭代、探索式代码理解,但前提是你得知道怎么指挥它。Vibe Coding 是 Karpathy 2025 年 2 月造的词——"让 AI 写代码,你忘记代码的存在就好"。Simon 的原则是AI 可以帮他检查拼写和语法,但所有带"
【代码】ubuntu 20.04 install tesseract (豆包)
本文摘要:介绍了基于Deepseek(C++)的SSE协议流式响应实现方案。通过HTTP协议构建请求,设计两个回调函数处理响应数据。重点包括:1)判断模型有效性;2)创建客户端;3)构建请求头及JSON格式请求体;4)实现流式响应处理逻辑,包括数据缓冲、解析和内容提取;5)处理网络请求及错误情况。代码实现了完整的流式对话功能,能够实时处理返回的聊天内容片段,并最终拼接完整响应。关键难点在于正确处理
Codex 的本质不是命令工具你用“自然语言”控制一个程序员。
Cursor可以通过mcp 操作Chrome。但是没有配置的话。没有都是新打开一个。还需要重复登录。现在可以通过配置来打开已经打开的页面我习惯使用 Win+R 来打开网页为了让上面的方式打开的Chrome支持调试需要修改注册表修改的内容修改Cursor配置mcp的配置如下。这个方法适合版本在144之前的浏览器。
实际上,Skills 最常见的一个用途,就是给 Claude 增加搜索能力,比如教它怎么用某个 API,或者怎么查数据库。接着,我们尝试修改 Claude 的系统提示词,让它输出一种特定格式的 Markdown,用来表示问题。它极大地取决于你用的是什么模型,Agent 的目标是什么,以及它在什么样的环境中运行。但在 Claude API 里,有各种各样的工具构建方式,比如执行 bash 命令、调用
如果只靠肉眼在浏览器里点点点,逆一个现代站点的签名参数,效率通常不高。Codex:负责调度、提问、整理上下文、生成代码js-reverse:负责快速定位 bundle 中的关键字符串、模块和调用链:负责在真实浏览器环境里验证推断是否成立这次我拿 FotMob 的x-mas参数做了一次完整实战,正好很适合说明这套组合拳的价值。这次 FotMobx-mas逆向,可以浓缩成一句话:用 Codex 编排分
摘要:安全研究人员发现,嵌入网页前端代码的Google Cloud API密钥在启用Gemini AI服务后,会静默获得AI访问权限,导致严重安全风险。扫描发现近3000个公开密钥,涉及金融机构等敏感机构。攻击者可窃取数据或制造高额账单(案例显示48小时产生8.2万美元费用)。谷歌已采取限制新密钥权限等措施,并建议开发者立即审计和轮换密钥。该事件警示开发者需重新评估API密钥的安全性,遵循最小权限
在使用 Claude Code 命令行工具时,如果直接配置三方代理地址 () 和秘钥 (sk-ant-
统一执行接口:所有工具都通过函数执行镜像工具模式:工具是从TypeScript源码镜像而来权限控制系统:支持基于上下文的权限检查执行状态跟踪:每个执行都返回完整的执行状态信息工具发现机制:支持按名称和路径搜索工具。
在 ChatGPT 回复的下面会多一个按钮,点击按钮可复制当前回复为 Markdown。Edge浏览器商店正在审核,目前只能下载扩展压缩包用开发者模式安装。
上周 Claude Opus 4.6 刚发布,我第一时间想接进项目里跑一下效果。结果老问题又来了——官方 API 要绑海外信用卡,延迟还飘忽不定,有时候一个请求 3 秒才回来。之前用 Claude Sonnet 4.6 的时候我就折腾过一轮中转方案,这次干脆把几种路线都重新测了一遍,记录下来给同样在纠结的兄弟们。直接说结论:稳定调用 Claude API 又不想折腾鉴权和网络问题,用 API 聚合
本文介绍了一种利用Claude Code提取小红书帖子内容并转换为md笔记的方法。配置要求包括Windows 10系统、Chrome浏览器和Thinkpad电脑。核心步骤包括:1)创建SKILL.md文件定义处理流程;2)从Chrome导出cookies;3)通过Python脚本解析帖子内容;4)视频转录处理;5)生成结构化Markdown笔记。该方法支持文字、图片和视频内容的提取,最终生成简洁明
Playwright Skill 和 Codex Chrome 浏览器操控都能让 AI 操作浏览器,但定位不同。要可复现,用 Playwright Skill。要当前登录态,用 Codex Chrome。要沉淀脚本,用 Playwright Skill。要临时排查,用 Codex Chrome。一句话总结:Chrome 看真实状态,Playwright 沉淀自动化。
本文介绍如何开发一个AI Prompt Enhancer Chrome扩展,帮助用户优化AI对话提示词。该扩展能自动识别豆包、通义千问等AI网站的输入框,一键补全提示词要素(受众、长度、结构等)。文章详细讲解了Chrome扩展Manifest V3的核心配置、Content Script注入机制、精准DOM元素定位等关键技术点,并对比了V3与V2的主要区别。开发过程涉及Service Worker
问题现象解决方案ChromeDriver 版本不匹配固定 Chrome 版本,手动下载对应驱动影刀社区版无法登录内网弹登录框超时换用纯本地离线工具ERP 按钮定位失败增加显式等待,改用文本定位Exchange NTLM 认证失败绕过内置组件,用定时任务弹窗阻塞服务器无人登录,流程卡死--headless后台运行内网离线跑 RPA,最大的挑战不是流程设计,是环境限制。没网、老系统、旧浏览器、权限收紧
chrome
——chrome
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net