logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ASR 1803 SDK 深度解析:从架构设计到语音识别最佳实践

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

ChatGPT客户端开发实战:从零构建高效AI对话应用

至此,我们已经构建了一个具备自动重试、流式响应、上下文管理、性能优化和安全特性的ChatGPT客户端核心框架。你可以在此基础上添加用户认证、对话持久化(数据库)、更复杂的上下文总结(当历史太长时,用AI总结之前对话)等功能。我将一个更完整的、包含配置示例和简单前端演示的样板项目放在了GitHub上,你可以直接克隆并运行:(此为示例链接,请替换为实际仓库地址)完整的Python Flask/Node

Claude Code本地大模型部署实战:从环境配置到生产级优化

我对比了PyTorch、TensorRT和ONNX Runtime在Claude Code上的表现,测试环境是RTX 4090显卡配32GB内存,模型参数规模为70亿。但真动手时会发现,从环境配置到性能优化,每一步都可能踩坑。这次部署经历让我深刻体会到,本地大模型部署不是简单的“安装运行”,而是一个系统工程。我现在的部署方案,在RTX 4090上能把内存占用从原来的14GB压到9GB左右,推理速度

Anaconda Prompt系统找不到指定路径的深度解析与AI辅助解决方案

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

从零构建高可靠语音通话App:WebRTC实战与优化指南

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

AI小智TTS克隆实战:从零构建高保真语音合成系统

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

AI视频模型部署实战:从选型到生产环境优化

每个线程使用独立的CUDA stream主线程初始化CUDA上下文后,工作线程通过继承使用上下文管理器基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(A

Agent与提示词工程实战:如何设计高效自动化工作流

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

Anaconda Prompt环境激活效率优化:从基础操作到高级技巧

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

ChatGPT Memory 机制深度解析:如何优化上下文管理与长期记忆

动手实验,官方把火山引擎的豆包语音全家桶都包好了:流式语音识别、大模型对话、音色克隆、WebRTC 一键跑通,半小时就能在浏览器里跟 AI 语音唠嗑。一旦超限,早期信息被无情截断,用户却以为它“记得”。我按上面的思路撸了一遍后,发现从零手搓虽然能跑,但真要把“听、想、说”串成低延迟的实时通话,还要兼顾回声消除、语音活动检测、流式 ASR/TTS,坑比想象的多。每次请求前,系统用当前 query 向

    共 47 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择