logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Android Studio集成三方3D数字人SDK实现智能语音交互的工程实践

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

AI语音助手实现方案:从零构建可扩展的语音交互系统

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

Android SpeechRecognizer语音识别集成实战:从原理到避坑指南

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

ChatGPT安卓部署实战:从零搭建到性能优化的完整指南

最近在尝试将类似ChatGPT的大语言模型部署到安卓端,发现这真不是一件容易的事。模型动辄几个G,手机那点内存和算力根本吃不消,实时对话更是卡成PPT。经过一番折腾,终于摸索出一套可行的方案,今天就来分享一下从零搭建到性能优化的完整过程。

ChatGPT转Word文档:AI辅助开发中的高效实现与避坑指南

在AI辅助开发的浪潮中,ChatGPT等大语言模型已成为我们生成代码、撰写文档、构思方案的得力助手。然而,一个普遍存在的痛点也随之而来:如何将ChatGPT生成的那些结构复杂、格式多样的文本内容,高效、准确地转换为一份格式规范、可直接交付的Word文档?手动复制粘贴不仅效率低下,还极易丢失原有的层级结构、代码块或列表格式。本文将深入探讨如何利用Python自动化这一流程,分享一套从解析到生成的高效

VSCode集成ChatGPT全指南:从环境配置到插件开发实战

通过这个项目,我们不仅得到了一个便利的开发工具,更深入理解了VSCode插件架构、Webview通信、API安全调用和异步编程。对话历史持久化:如何将会话加密保存到本地,实现“关掉VSCode也不丢失对话”?预设提示词模板:集成“代码审查”、“生成测试用例”、“解释复杂函数”等一键提问按钮。多AI提供商支持:除了OpenAI,是否可以接入Claude、DeepSeek或国内的大模型API?语音输入

音频开发入门:从ACC到MP3再到PCM的转换原理与实战

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

Android WebRTC 断网重连实战:从原理到稳定连接的实现

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

Android Moshi序列化:从原理到高性能实践指南

处理@FromJson@ToJson// 扩展函数简化使用基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配

Android SpeechRecognizer语音识别集成实战:从原理到避坑指南

基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。架构理解:掌握实时语音应用的完整技术链路(ASR→LLM→TTS)技能提升:学会申请、配置与调用火山引擎AI服务定制能力:通过代码修改自定义角色性

    共 47 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择