logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Android系统接入豆包大模型SDK:从技术选型到生产环境避坑指南

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

8bit PCM转16bit PCM实战:音频处理中的位深转换技术解析

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

Android JSON解析实战:从GSON迁移到Moshi的性能优化与避坑指南

FromJsonnull // 安全处理空值@ToJson) {value?基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能

ARS语音识别算法实例:从零搭建高准确率语音识别系统

通过本文,我们完成了从零搭建ARS语音识别系统的全过程。这套系统在噪声环境下的识别准确率可达92%,比传统方法提升15%。结合说话人识别实现个性化适配加入情感识别提升交互体验探索多模态融合(语音+视觉)的识别方式如果你想快速体验语音识别技术的魅力,可以尝试从0打造个人豆包实时通话AI动手实验,它提供了完整的ASR到TTS的交互闭环,即使是新手也能轻松上手。我在实际操作中发现它的API设计非常友好,

Android TextToSpeech speak failed: not bound to TTS engine 问题解析与实战解决方案

解决问题的核心在于理解TTS的异步初始化特性。通过合理的状态管理和错误处理,可以构建稳定的语音功能。集成第三方TTS服务(如Google Cloud TTS)实现多引擎切换功能添加离线语音包支持优化语音合成参数(语速、音调等)如果你想体验更强大的实时语音交互能力,可以尝试从0打造个人豆包实时通话AI实验项目,它集成了语音识别、智能对话和语音合成的完整链路,我在实际体验中发现其API设计非常友好,适

基于Antonio Gulli的Generative AI Patterns:AI辅助开发架构实践指南

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

ChatGPT绘图功能技术解析:从API调用到图像生成实战

提示词工程是关键:好的提示词能显著提升图像质量,需要不断测试和优化错误处理要完善:网络波动、API限流等异常情况都需要妥善处理性能优化要持续:从缓存、并发、重试等多个角度优化系统性能成本控制要重视:AI服务的成本可能快速增长,需要提前规划如果你对AI绘图技术感兴趣,想要亲自动手实践,我推荐你尝试从0打造个人豆包实时通话AI这个动手实验。这个实验不仅涵盖了AI绘图,还涉及语音识别、对话生成等更多AI

App语音视频通话实战:WebRTC与声网SDK的架构对比与性能优化

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

2024提示词工程白皮书实战指南:从理论到生产环境的最佳实践

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

AI代理提示词工程实战:从设计原则到效率提升的最佳实践

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

    共 39 条
  • 1
  • 2
  • 3
  • 4
  • 请选择