登录社区云,与社区用户共同成长
邀请您加入社区
通过以上示例,你应该对正则表达式中的零宽断言有了更深入的理解。零宽断言在处理复杂文本匹配问题时非常有用,可以帮助你快速准确地定位和提取所需信息。如果你对正则表达式还有更多的需求,不妨试试Hey Cron。Hey Cron 提供了丰富的在线工具,包括正则表达式生成器,帮助你快速生成和测试正则表达式,还可以用于时间戳转换、JSON 格式化、Base64 编码解码等,非常适合开发者在日常工作中使用。希望
如何验证快递单号是否符合对应的快递公司呢,收集到以下的正则,可能会帮到我们
最近项目需求,需要验证快递单号是否符合对应的快递公司,还找了很久,找到一篇文章有种这样的记载:淘宝开放平台地址戳戳戳{"companyMap":{"companyReturnList":[{"code":"ZJS","id":"103",...
摘要 本文从信息论基础概念出发,系统阐述了熵、交叉熵与KL散度的理论关系及其在机器学习中的应用逻辑: 信息熵作为不确定性度量,量化系统的平均信息量;KL散度衡量两个概率分布的差异,具有非负性和非对称性;交叉熵则作为连接桥梁,其最小化等价于最小化KL散度,成为分类任务的核心损失函数。 在拒绝采样部分,对比了统计学与大模型应用的差异:统计学中是通过辅助分布逼近目标分布,而大模型训练中则是利用奖励模型筛
摘要 语言模型评估指标困惑度(Perplexity) 困惑度(PPL)是衡量语言模型预测能力的核心指标,表示模型预测下一个词时的平均不确定程度。其计算基于条件概率的乘积,通过取对数避免数值下溢,最终取指数得到PPL值。PPL越低,模型预测越准确。公式为:$PPL = \exp(-\frac{1}{N}\sum \log P(w_i|w_{<i}))$。面试中需强调其与交叉熵的关系($PPL = e
文章摘要: 本文探讨了大模型深度思考(CoT)的自主切换技术(AutoThink)与新型优化器Muon。针对CoT的“过度思考”问题,提出三类解决方案:基于规则(熵值/概率差值)、分类模型及多阶段强化学习(AutoThink),后者通过奖励机制动态平衡思考与效率。Muon优化器则通过正交化梯度动量,减少显存占用(仅为AdamW一半)并加速收敛,尤其适合分布式训练。两项技术分别提升模型推理效率与训练
本文对比分析了NLP领域两大里程碑模型LSTM和BERT的核心差异。LSTM作为时序模型,通过门控机制实现序列记忆,但存在串行计算和长程依赖问题;而BERT基于Transformer编码器,利用自注意力机制实现并行全局语义理解。关键区别在于:1)LSTM适合序列生成任务,BERT擅长语义理解;2)BERT支持并行计算和预训练范式,显著提升效率与泛化能力。文章还深入解析了混合专家模型(MoE)架构,
本文介绍了如何在星图GPU平台上自动化部署Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF镜像,该镜像专注于逻辑推理和代码分析,特别擅长正则表达式编写与优化。通过该模型,开发者可快速生成高效的正则表达式模式,应用于文本处理、数据提取等场景,同时避免常见陷阱,提升开发效率。
本文介绍了如何在星图GPU平台上自动化部署Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF镜像,实现高效的正则表达式编写与调试。该镜像特别擅长逻辑推理和代码分析,可应用于日志解析、数据验证等文本处理场景,帮助开发者快速构建和优化复杂模式匹配解决方案。
本文介绍了如何在星图GPU平台上自动化部署【ollama】DeepSeek-R1-Distill-Qwen-7B镜像,高效支持开发者日常SQL生成、正则表达式编写与JSON Schema推导等任务。该轻量级大语言模型可在本地或云端快速启用,显著提升数据库查询构建、日志解析及API接口定义等工程效率。
下面把 Codex CLI(OpenAI 那个 codex 命令行)最常见的几类安装报错,按现象+原因+一键修复给你整理好,照着对号入座即可。
DeepSeek推出DeepSeek Sparse Attention (DSA),通过稀疏注意力机制优化长文本处理效率。核心包括闪电索引器(轻量级FP8加速相关性计算)和细粒度Token选择(仅处理Top-k关键Token),显著降低计算复杂度(从$O(L^2)$降至$O(Lk)$)。训练分两步:先密集热身优化索引器,再稀疏训练适配全模型。实测在128K上下文中,推理成本预填充阶段降低50%-6
本文系统介绍了信息检索算法从TF-IDF到BM25的演进历程。TF-IDF通过词频(TF)和逆文档频率(IDF)的乘积衡量文档相关性,但其存在词频线性增长、文档长度偏差和缺乏调参空间三大缺陷。BM25针对这些问题进行了优化:引入k1参数实现词频的非线性饱和,通过b参数进行文档长度归一化处理,有效抑制了高频词堆砌和长文档优势。实战对比显示,BM25能更准确地识别文档相关性,避免TF-IDF的评分偏差
本文介绍了如何在星图GPU平台上自动化部署DeepSeek-R1-Distill-Qwen-1.5B 本地智能对话助手 (Streamlit 驱动) 镜像,实现正则表达式生成与边界用例验证一体化输出。用户可在本地完成手机号匹配规则推导、测试用例设计及re引擎级验证,适用于日志解析、表单校验等工程化文本处理场景。
本文介绍了如何在星图GPU平台上一键自动化部署🐋 DeepSeek-R1-Distill-Qwen-1.5B本地智能对话助手镜像,并展示其在正则表达式生成和测试用例设计中的实际应用。该轻量级模型能高效生成语法准确的正则表达式和覆盖边界条件的测试代码,提升开发效率,适用于代码辅助生成和自动化测试等编程场景。
正则表达式(regex)是文本处理的核心基础技术,其本质是通过模式匹配与替换实现非结构化数据的精准提取与标准化。掌握捕获组、贪婪/非贪婪匹配、预编译等原理,可显著提升数据清洗效率与代码可维护性。在电商运营、用户行为分析、NLP预处理等高频场景中,正则被广泛用于清洗评论乱码、提取商品ID、标准化手机号与日期格式等任务。结合re模块与pandas.str.replace等国产主流工具链,无需依赖境外平
本文介绍了在星图GPU平台上自动化部署DeepSeek-OCR-2镜像,并利用Python正则脚本对OCR输出进行高效数据清洗的方法。通过构建四层清洗流水线,可将模型识别的非结构化文本(如发票、单据)转化为可直接入库的结构化数据,解决了日期、金额等字段格式混乱的常见问题,提升数据可用性。
本文介绍了如何在星图GPU平台上自动化部署Qwen3-4B-Thinking-2507-GPT-5-Codex-Distill-GGUF镜像,该模型专精于将自然语言描述转化为可用的正则表达式代码。用户可通过该平台快速搭建环境,轻松应用于数据验证、文本提取等开发场景,显著提升处理字符串匹配任务的效率。
YaRN是一种突破性的大语言模型长文本处理技术,通过创新的"高频外推+低频内插"策略解决了传统位置编码的长度限制问题。该技术将RoPE位置编码的不同频率分量进行分层处理:对高频信息保留精细位置关系,对低频分量采用压缩内插,同时完全保留极端低频分量。相比完全重新训练,YaRN只需少量微调即可实现数倍长度扩展,既保持了绝对位置的确定性,又具备相对位置的灵活性。这种智能的频率分配方案有效避免了位置信息漂
摘要: DeepSeek-V3 引入两大核心技术突破:MTP(多 Token 预测) 和 DCA(双块注意力),显著提升模型效率与长文本处理能力。 MTP:打破传统单 Token 预测模式,通过并行预测未来多个 Token 并验证,实现推理加速(理论提速近1倍)。其训练时强制模型学习长程依赖,推理时通过自投机解码(Self-Speculative Decoding)三步走(预测→验证→采纳)高效生
AI只会输出文字,怎么让它操作文件、打开软件?本篇讲工具系统的设计思路。核心是设计一套AI能学会、程序能读懂的“暗号”——[TOOL]标记协议。AI输出[TOOL] ls(“src”) [/TOOL],程序用正则解析出工具名和参数,通过switch分发到对应函数执行,最后把结果写回对话历史,让AI“看到”自己做了什么。所有工具函数遵守统一契约:返回{success, data/error}。添加新
如果你已经了解了 AI Agent 是什么,那么接下来面试官最爱考的,就是它的。一个完整的 AI Agent 就像是一个高度自动化的“数字员工”,为了能独立完成复杂任务,它必须具备一套完整的“器官”。今天我们来把 Agent 拆开揉碎,看看它到底是由哪几个核心部件组成的!
本文介绍了如何在星图GPU平台上自动化部署Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF镜像,实现高效的正则表达式语法树构建与逻辑推演。该轻量级AI模型特别擅长代码解释和算法分析,可应用于开发环境中的正则表达式调试、自动化测试等场景,显著提升开发效率。
DeepSeek提出的原生稀疏注意力机制(NSA)通过"压缩、选择和滑动窗口"三大策略优化长文本处理。NSA首先压缩历史文本为关键向量进行粗筛选,然后精选高相关片段细读,同时保留最近上下文的精确计算,最后通过门控机制动态聚合三部分结果。相比传统全注意力机制,NSA显著降低了平方级计算复杂度,在解码、推理等任务上实现最高11.6倍和9.0倍的加速,同时保持模型性能。这种"全局把握、重点精读、强化近期
Your AI remembered wrong?That’s memory decay.Minta checks for stale, conflicting, and fragmented AI memory.All local. No API calls.Claude Code · Cursor · Codex · VS Codegithub.com/xinchen03/minta
https://github.com/xinchen03/minta,欢迎各位一起反馈优化,也麻烦大家点点🌟🌟。诚挚招募团队,一起打磨产品、拓展生态,把这个项目做得更远~重新定义AI记忆管理工具。AI记忆居然也会“生病”感兴趣的小伙伴可以体验/交流!
鸿蒙harmonyOS:案例练习正则表达式验证登录
【代码】鸿蒙ArkUI设置应用全屏。
我们的HarmonyOS计算器!它不仅能够进行基本的算术运算,还能处理复杂的表达式,甚至包括阶乘和幂运算。通过实现这个看似简单的应用,我们实际上涉及了许多重要的编程概念:正则表达式、栈的使用、字符串处理、UI设计等等。记住,每一个伟大的应用都是从简单的想法开始的。今天的计算器,明天可能就是改变世界的下一个大应用!所以,继续编码,继续创造,让我们一起用HarmonyOS改变世界!最后,如果你在实现过
正则表达式
——正则表达式
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net