登录社区云,与社区用户共同成长
邀请您加入社区
想把 LLaMA 的上下文从 4K 拉到 32K,但一跑就 OOM?别急着换模型。FlashAttention 的分块机制配合 ops-transformer 的 chunked prefill,让你在昇腾NPU 上跑 32K 上下文成为可能。这篇文章手把手带你配置长上下文环境,30 分钟搞定。
《人形机器人产业观察:灵巧手是制约发展的关键瓶颈》 当前人形机器人产业面临一个核心矛盾:虽然机器人的"下半身"运动能力已取得显著进步,但"上半身"的灵巧操作仍处于原始阶段。灵巧手作为机器人产业的关键瓶颈,其能力上限直接决定了机器人能完成的任务和应用场景。 灵巧手面临五大技术挑战: 机械结构极限:需在手掌大小空间内集成20+微型驱动器和传感系统 力控精度要求:需实现0.5N到100N的200倍力控跨
本文系统探讨了游戏装备系统的数值设计原理,涵盖装备稀有度体系、随机属性生成、强化系统和套装设计等核心内容。重点分析了不同概率分布在属性生成中的应用,包括均匀分布、正态分布和Beta分布的使用场景;详细阐述了强化系统的成功率曲线设计和保底机制数学模型;同时探讨了套装效果的数值平衡与组合优化问题。通过暗黑破坏神、DNF和原神等案例,展示了不同装备系统的设计特点。文章为游戏开发者提供了装备系统设计的完整
微软AutoGen对“Agent”的定义是:“一个具备‘说话能力’、‘工具使用能力’、‘代码执行能力’的自主或半自主软件实体”——它的核心是“对话式交互”,多个Agent之间通过“自然语言对话”的方式进行通信。英伟达NVIDIA NIM Agent对“Agent”的定义是:“一个部署在NVIDIA NIM平台上的、具备‘推理能力’、‘工具使用能力’的自主或半自主软件实体”——它的核心是“高性能推理
Google I/O 2026亮点速览 谷歌开发者大会发布多项重磅产品: Gemini 3.5 Pro(代号Cappuccino)编程能力达GPT-5.5的92%,成本仅1/15-1/20; Android XR智能眼镜(499美元起,<80g)配备Micro-LED屏和实时视觉AI; Gemini Spark全时Agent支持自动邮件管理、购物等任务; Aluminum OS(三系统融合)将于Q
TDengine 的数据模型围绕一个核心设计理念——一个数据采集点一张表这与传统关系型数据库"所有设备共享一张宽表"的思路截然不同。为了在"一设备一表"的基础上实现高效的聚合查询和统一管理,TDengine 创造了**超级表(STable)**机制——同类设备共享 Schema,通过 Tag 区分个体。本文深入解析三种表类型的设计理念、内部存储结构和适用场景。超级表是同类数据采集点的模板-- 列(
RAM是RandomAccessMemory的首字母缩写。它是一种主存储器,用于存储当前正在使用的信息。信息可以是正在处理的数据或程序代码。它是一种读写存储器,这意味着它几乎可以同时存储(写入)和访问(读取)数据。但RAM是易失性或临时性存储器,即当电源被移除时其内容会被擦除。**RAM是一种快速存取存储器,因为无论其物理位置如何,它都可以随时随机存储和访问数据。**它存储启动设备所需的必要指令和
开发的好好的才发现ArkTs真的很严格,感觉比Ts的规范更严格一些,开发时需要遵循规范,以免踩坑。
可以看见,关于Android UI卡顿的性能分析还是有很多工具的,上面只是介绍了应用开发中我们经常使用的一些而已,还有一些其他的,譬如Oprofile等工具不怎么常用,这里就不再详细介绍。通过上面UI性能的原理、原因、工具分析总结可以发现,我们在开发应用时一定要时刻重视性能问题,如若真的没留意出现了性能问题,不妨使用上面的一些案例方式进行分析。但是那终归是补救措施,在我们知道上面UI卡顿原理之后我
ANR 全称 Applicatipon No Response;Android 设计 ANR 的用意,是系统通过与之交互的组件(Activity,Service,Receiver,Provider)以及用户交互(InputEvent)进行超时监控,以判断应用进程(主线程)是否存在卡死或响应过慢的问题,通俗来说就是很多系统中看门狗(watchdog)的设计思想。这道题问的是ANR的线上监控,所以我们
启动时间优化毫无疑问,应用的启动速度越快越好。本文可以帮助你优化应用的启动时间:首先解释启动过程内部机制;然后讨论如何分析启动性能;最后,描述了一些常见的影响启动时间的问题,并就如何解决这些问题给出一些提示。
面试性能优化专题的高阶答法 性能优化面试的核心不是罗列方向,而是展示问题闭环能力:如何定位问题、分析根因、设计方案并验证收益。 1. 回答结构 采用“背景→现象→数据→定位→根因→方案→收益→风险”框架,强调: 基线数据:用指标量化问题(如首屏时长、OOM率) 关键路径:聚焦用户感知最强的阻塞点(如主线程任务、锁等待) 副作用:优化后如何监控回归风险(如首次进入其他页面变慢)。
本文深入探讨MySQL慢查询问题的排查与优化过程,涵盖慢查询日志分析、执行计划优化、系统性能瓶颈排查及数据库配置调整,帮助提高查询效率并提升数据库性能。
想要抓取开机启动整个过程的trace,放到perfetto上进分析,但是发现开机过程中无法连接上设备,没办法抓到完整的trace,所以perfetto无法分析出整个开机过程。准备好一个config文件,主要用于配置perfetto抓取时候的相关配置,比如要抓哪些tag等,是否也抓取日志等,这个配置官网给了一个最简单的版本。pushboottrace.pbtxt文件到/data/misc/perfe
这周我们为 AI 零代码应用生成平台引入一个全新的技术架构 —— AI 智能体工作流,通过 LangGraph4j框架重构代码生成逻辑,并补充搜集图片素材、代码质量检查等过程,让生成的网站更真实可靠。
OpenAI Codex 是基于 GPT-5.5 的 AI 编程 Agent,支持自主修改文件、执行测试、提交 Pull Request。2026年5月14日,Codex 正式登陆 iOS 和 Android,以 ChatGPT 移动端为入口,Free、Go、Plus 全套餐可用。你不需要单独下载新 App——更新现有 ChatGPT 即可从手机远程监控和驾驭跑在 Mac 上的 Codex 实例。
2026年WordPress网站服务器配置优化已不再是可选项,而是决定网站生死的核心战场。本文由资深WordPress技术专家撰写,深度解析PHP、MySQL、Nginx/Apache调优方案,揭露3大高频运维误区,附真实避坑案例与可直接落地的配置代码,帮助企业技术团队彻底解决网站慢、崩、挂等顽疾。
本文记录了针对192.168.1.7靶场的渗透测试过程。首先通过nmap扫描发现开放22、80、3306、8000端口,其中8000端口运行WordPress系统。使用sqlmap成功读取/etc/jimmy.txt获取jimmy用户密码"HandsomeHU"。通过SSH登录后发现命令受限,采用绝对路径/bin/ls或强制sh会话绕过限制。随后审计WordPress配置文件获取数据库凭证,查询w
本文介绍了心晴驿站鸿蒙应用的数据存储方案设计与实现。针对情绪树洞等极致隐私数据采用内存临时存储,测评记录等可控数据基于Preferences封装安全本地存储。文章分析了原生存储痛点,提出三层架构设计,通过常量配置层、工具封装层和业务调用层实现统一管控。详细展示了ArkTS存储工具的实现,包括初始化、增删改查和批量清空功能,并强调隐私合规设计准则。最后演示了测评结果存储等业务场景调用方法,为鸿蒙应用
本文介绍了一个自动化部署MySQL Exporter的Shell脚本方案。该脚本通过一键执行完成下载安装、创建监控用户、配置权限、设置systemd服务等全流程,解决了手动部署在多服务器场景下的效率低下和配置不一致问题。脚本内置了MySQL root密码和exporter用户密码(需按需修改),部署后自动启用服务并开放9105端口供Prometheus采集指标。该方案特别适合需要批量部署MySQL
MySQL用户权限管理是保障数据库安全的关键环节。本文详细介绍了MySQL用户管理的核心操作,包括创建用户、删除用户、修改密码等基础操作,以及权限授予、回收和查看等权限控制方法。重点强调了最小权限原则的重要性,建议按业务分工创建专用用户并分配必要权限,避免使用root账号带来的安全风险。文章还提供了完整的实操流程和安全最佳实践,帮助读者掌握企业级MySQL用户权限维护技能,有效防范数据泄露和误操作
上一篇文章中,我们解析了 Claude Code 的架构、Tool、Skill,感兴趣可以翻一下。这篇文章我们就来讲讲CC的 顶级 Prompt 的组成。下一篇文章我们再来讲讲 memory 记忆模块。
回顾最近的实践,我们认为一个核心认知是: AI 辅助开发的效果,上限不是模型的能力,而是你给它的上下文设计。模型本身的推理能力和代码生成能力已经够强了。真正拉开差距的,是你能不能把项目的隐性知识(架构约束、命名约定、反模式、历史踩坑)结构化地组织起来,让 AI 在正确的时刻、以正确的方式获取到正确的信息。我们的三层体系(调度层 → 约束层 → 参考层)+ 否定词保护 + References 反幻
Google 在 5 月 12 日的 Android Show: I/O Edition 2026 中,把 Android 描述为进入 agentic Gemini 时代的智能系统:Gemini Intelligence、Chrome 自动浏览、车机 Gemini、Googlebook、隐私与安全更新被放在同一组叙事中。车机更新还显示,Gemini 会结合车辆硬件、地图、消息、日历等上下文处理任务
【LangChain源码剖析(三)】文章摘要: 本文深入解析LangGraph在生产化Agent系统中的核心作用。针对AgentExecutor存在的三大局限(scratchpad膨胀、无法条件分支、无状态快照),LangGraph提出创新解决方案:1)通过State+Reducer实现声明式状态管理;2)利用Conditional Edge支持任意分支逻辑;3)基于Checkpoint机制实现状
到这里,应该都能理解,新结构的好处显而易见了,整体更清晰、职责更单一、后续模块化更自然,但是就是项目管理成本提高了,不过对中大型项目来说更好,对中小型项目来说就有些浪费表情的感觉。
本文系统阐述了Android权限管理机制的演进历程与技术架构。从早期静态权限模型到Android 6.0引入的运行时权限机制,再到Android 10-12的精细化控制,详细解析了权限系统的核心组件、验证流程及SELinux安全策略。通过标准化请求流程、后台权限处理等最佳实践,以及企业级权限管理方案的设计,为开发者提供安全开发指南。文章还展望了隐私沙盒、硬件级控制等前沿技术,并给出完整的安全开发流
本文系统介绍了Android多线程编程的核心技术与实践应用。首先阐述了多线程基础概念,包括线程生命周期、并发模型和通信机制。重点分析了Android多线程框架,如Handler/Looper、Executor线程池和Kotlin协程,比较了各方案的优缺点及适用场景。针对线程安全挑战,详细讲解了同步机制、死锁预防和内存泄漏解决方案。在性能优化方面,提供了线程池配置、ANR避免策略及测试方法。文章还包
可以看成同一只龙虾在公开场合的「日常人格展示」——有人健身打卡,有人聊游戏开黑,有人写跨界心得。若龙虾接在本地助手上,由助手在后台完成「想一句、送回平台」;若在网页端,则由平台侧调度模型——对主人而言,始终是。里,由本地助手完成一轮推理后,再通过 HTTP 或另一条 WS 上行把内容写回平台。可以把它理解成:主人雇了两只「会先聊一遍」的代理人,自己只在签字画押环节出现。此时两只龙虾在业务上都已经「
读完这篇,你应该会把LangChain 的理解顺序彻底倒过来,不是先有 Chain、再有Agent、最后才碰Runnable。而是恰恰相反。LangChain 先把几乎所有能力都压成Runnable,再在它上面长出 LCEL、RAG、Chain、Agent 和一整套运行时能力。
这篇文章主要介绍了Linux系统下的基础文件I/O操作,重点包括:文件概念理解:从狭义和广义角度解释文件,说明文件操作的本质是对文件属性和内容的操作。C语言文件接口回顾:演示了文件打开、写入和读取的基本操作解释了文件路径问题,说明进程知道自己的运行目录提供了完整的代码示例展示fopen、fwrite、fread等函数的使用系统层面理解:文件操作本质是进程通过系统调用实现的磁盘文件由操作系统管理标准
本文提出一套面向家居导购Agent的自动化评估链路:基于结构化多维度(基础/专业/补充指令+用户画像)Benchmark,采用LLM-as-a-judge实现91.9%准确率的自动评分,并通过人工抽样校准;在“放我家”落地后,量化对比发现gpt51最优(总分0.680),较当前线上模型qwen3-vl提升16.4%;核心瓶颈为:无法识别已有家具、抓不住核心需求、推荐过度。
CO-STAR框架:6维度提示词优化指南 摘要 本文介绍了CO-STAR提示词框架,通过6个维度帮助用户更有效地与AI对话。该框架包含: Context(上下文)- 交代背景信息 Objective(目标)- 明确具体任务 Style(风格)- 指定输出格式 Tone(语气)- 设定表达方式 Audience(受众)- 锁定目标读者 Response(响应)- 规定结果格式 文章通过实际案例展示了
2026年AI工程化五大趋势:从模型到产品的关键路径 摘要: 随着AI技术成熟,模型落地成为核心挑战。本文基于MLOps实战经验,剖析2026年AI工程化的五大趋势:1) 模型服务化(Model as a Service)成为标配,通过标准化API实现热更新和A/B测试;2) 边缘AI爆发式增长,利用量化、剪枝技术降低延迟至10ms内;3) 自动化MLOps流水线普及,实现从开发到部署的全流程管理
摘要:本文基于10年TOB企业数字化经验,总结出低代码平台选型的5大核心维度:技术能力(引擎完整性、并发支撑、部署方式)、业务适配(用户定位、行业模板、流程复杂度)、安全合规(数据加密、信创要求、权限管控)、扩展生态(API集成、开放架构、AI能力)和服务生态(实施支持、客户案例、供应商实力)。特别强调选型不是选功能最全或最便宜的,而是选择与企业长期发展匹配的合作伙伴。
android
——android
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net