logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Cloudflare 拦截 ChatGPT 请求的解决方案:技术原理与实战绕过

Cloudflare 并非不可逾越,但它把“低成本滥用”的门槛抬高了。对开发者而言,真正的解不是永远绕盾,而是把绕盾当成临时通道,最终迁移到官方 API;重试 + 退避:用 tenacity 封装异步重试,按 1s/3s/10s 阶梯退避。分布式请求:把任务拆到不同地域的云函数,自带轮换出口。行为随机化:请求间加随机思考时间、滚动窗口,降低模式特征。双通道热备:官方 API 与逆向节点同时跑,前者

Claude Code前端提示词实战:从设计原则到高效落地

通过将提示词视为需要精心设计的数据结构,而非普通字符串,我们成功构建了一套前端可用的工程化方案。这套方案涵盖了从设计、生成、优化到缓存、容错的完整生命周期。在实际项目中,它帮助我们将平均对话响应速度提升了40%以上,并且显著提高了意图识别的准确率。如何平衡提示词的复杂度与LLM的推理延迟?更详细、精准的提示词(例如包含多个步骤的思维链示例)往往会得到质量更高的输出,但同时也增加了输入Token和模

DeepSeek R1与ChatGLM技术对比:智能客服场景下的选型指南

网上资料要么太理论,要么就是简单的“Hello World”测试,对真实生产环境的参考价值有限。于是我们自己做了一系列压力测试和对比分析,把踩过的坑和总结的经验记录下来,希望能帮到有同样困惑的朋友。建议大家在选型前,务必用自己业务的高频问题集和真实对话流,对候选模型做一次POC测试,数据会比任何评测文章都更有说服力。:AWS c5.2xlarge (8 vCPU, 16 GiB RAM),Ubun

ChatGPT越狱指令技术解析:原理、风险与防御方案

过度依赖正则表达式正则表达式虽然快,但面对同义词替换、错别字、插入无关字符等变体时很容易失效。结合语义理解和模式识别。忽略上下文累积效应单轮对话看起来安全,但多轮对话后可能形成漏洞。实现跨轮次的风险追踪。性能优化导致的安全漏洞为了降低延迟而简化安全检查。分层检查,高频操作用简单规则,低频深度检查用复杂算法。

Android ASR 实战:基于 Vosk 的高效语音识别方案与性能优化

Vosk为Android平台提供了高效、灵活的ASR解决方案。通过合理的优化,可以实现接近实时的语音识别体验。结合端侧机器学习进行语音增强实现自定义热词增强功能探索更小的神经网络架构基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架

AI提示词嵌入式开发实战:从设计模式到性能优化

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

Cloudflare 拦截 ChatGPT 请求的解决方案:技术原理与实战绕过

Cloudflare 并非不可逾越,但它把“低成本滥用”的门槛抬高了。对开发者而言,真正的解不是永远绕盾,而是把绕盾当成临时通道,最终迁移到官方 API;重试 + 退避:用 tenacity 封装异步重试,按 1s/3s/10s 阶梯退避。分布式请求:把任务拆到不同地域的云函数,自带轮换出口。行为随机化:请求间加随机思考时间、滚动窗口,降低模式特征。双通道热备:官方 API 与逆向节点同时跑,前者

基于DeepSeek搭建高并发智能客服系统的架构设计与性能优化

痛定思痛,我把目光投向了主打“异步+量化”的 DeepSeek,用 4 周时间重构了一套高并发智能客服。上线后同等硬件下,平均响应降到 1.1 s,P99 1.8 s,内存节省 30%,这篇笔记就把全过程拆给你看。去年双十一,我负责的老旧客服系统被 3w QPS 打爆,CPU 飙到 95%,平均响应 2.8 s,用户排队 40 s 以上。一句话总结:DeepSeek 把“异步调度”和“模型量化”做

Claude Code前端提示词实战:从设计原则到高效落地

通过将提示词视为需要精心设计的数据结构,而非普通字符串,我们成功构建了一套前端可用的工程化方案。这套方案涵盖了从设计、生成、优化到缓存、容错的完整生命周期。在实际项目中,它帮助我们将平均对话响应速度提升了40%以上,并且显著提高了意图识别的准确率。如何平衡提示词的复杂度与LLM的推理延迟?更详细、精准的提示词(例如包含多个步骤的思维链示例)往往会得到质量更高的输出,但同时也增加了输入Token和模

DeepSeek R1与ChatGLM技术对比:智能客服场景下的选型指南

网上资料要么太理论,要么就是简单的“Hello World”测试,对真实生产环境的参考价值有限。于是我们自己做了一系列压力测试和对比分析,把踩过的坑和总结的经验记录下来,希望能帮到有同样困惑的朋友。建议大家在选型前,务必用自己业务的高频问题集和真实对话流,对候选模型做一次POC测试,数据会比任何评测文章都更有说服力。:AWS c5.2xlarge (8 vCPU, 16 GiB RAM),Ubun

    共 63 条
  • 1
  • 2
  • 3
  • 7
  • 请选择