logo
publist
写文章

简介

个人简介:(1)荣誉与身份:2024年度CSDN博客之星TOP71、CSDN博客专家/全栈领域优质创作者、阿里云开发者社区专家博主、华为云.云享专家!全网中文IP:正在走向自律 (2)领域专长:人工智能、AI大模型、数字人、Java、Python、服务器管理、第三方支付等! (3)创作理念:通过分享 IT 行业的专业见解、案例分析和实用技巧,帮助读者更好地了解 IT 领域的发展动态和应用实践! (4)粉丝支持:感谢全网2万+粉丝的关注与支持,我会继续努力,带来更多优质内容! (5)座右铭:创作之路漫漫其修远兮,吾将上下而求索! (6)关注交流:微信公众号《正在走向自律1》,交流技术心得,领取技术干货!

擅长的技术栈

人工智能AI大模型数字人JavaPython

可提供的服务

提供技术知识问答,更多请关注交流:微信公众号《正在走向自律1》,交流技术心得,领取技术干货!

DeepSeek 智慧城市应用:交通流量预测(9/18)

在 DeepSeek Serving 中,需要定义 API 接口来接收输入数据和返回预测结果。可以通过配置文件或代码来定义接口的输入输出格式、请求处理逻辑等。self.model = load_model(model_path) # 加载导出的模型。

文章图片
#智慧城市#人工智能#DeepSeek
FunASR:开启语音识别新世界的开源宝藏

FunASR 是阿里巴巴达摩院开源的语音识别工具包 ,它的诞生可谓意义非凡。在语音识别技术发展的长河中,研究人员和开发者常常面临着诸多挑战,比如模型训练的复杂性、不同场景下模型的适应性以及开发成本等问题。FunASR 的出现,就像是为这些难题提供了一把万能钥匙,旨在帮助研究人员和开发者更高效地进行语音识别模型的研究和生产,在语音识别的学术研究和工业应用之间成功架起了一座坚实的桥梁。通过支持工业级语

文章图片
#语音识别#人工智能
AiOnly平台x FastGPT:一键调用Gemini 3 Pro系列模型从零构建AI工作流

摘要:本文介绍了如何通过AiOnly平台轻松接入Gemini3Pro和NanoBananaPro两大顶级AI模型,解决传统接入方式中注册繁琐、成本高昂等问题。AiOnly提供一站式模型调用服务,支持国内外80+模型,遵循OpenAI接口标准。文章详细演示了从注册、充值到获取API密钥的全流程,并指导用户通过FastGPT平台搭建专属AI应用——学习规划师,实现个性化学习计划生成。该方案显著降低了A

文章图片
#人工智能#大数据#数据库
手把手教你在Linux本地搭建超酷数字人LiveTalking

本文详细介绍了如何在Linux系统上搭建开源实时数字人引擎LiveTalking的全过程。从硬件需求(推荐RTX3060显卡、16GB内存等)到软件环境配置(Ubuntu20.04、Python3.8等),逐步指导安装显卡驱动、CUDA Toolkit、cuDNN等必要组件,并通过Docker部署SRS服务、GPT-SoVITS和LiveTalking三大核心服务。特别提供了使用musetalk模

文章图片
#linux#运维#服务器 +3
FunASR开源项目实战:解锁语音识别新姿势

FunASR是阿里巴巴达摩院开源的高性能语音识别工具包,具备语音识别、说话人分离、标点恢复等核心功能。项目采用先进的Paraformer非自回归架构,在中文识别任务上表现优异,支持实时与非实时处理模式。通过预训练模型和易用API,可快速搭建智能语音助手、会议转写、视频字幕等应用场景。技术亮点包括:多说话人识别能力、低词错误率、抗噪性能强,并支持模型微调和多语言扩展。未来将深化与NLP、CV技术的融

文章图片
#语音识别#人工智能#开源
深入探索DeepSeek最新版本,1024程序员节全面技术评测

DeepSeek在2025年程序员节前夕发布V3系列重大更新,展现多项技术突破。V3.1引入混合推理架构,支持快速响应与深度思考双模式;V3.2-Exp采用稀疏注意力机制(DSA),将长文本处理复杂度从O(n²)降至O(nlogn)。评测显示,新版本在保持性能的同时实现API成本降低50%以上,支持128K上下文长度,并在编程、数学推理等任务中表现优异。企业级应用方面,增强了严格模式函数调用能力,

文章图片
#DeepSeek#人工智能
探索LiveTalking:开启实时数字人交互新时代

LiveTalking是一款开源实时互动数字人引擎,支持通过音频流驱动50fps高清虚拟主播。核心技术包括:1)多模态大模型实现智能交互;2)ER-NeRF增强的面部表情捕捉;3)跨域网络实现音频到全身动作的实时转换。系统提供三种部署方式(Gradio/WebRTC/RTMP),在RTX3060上可实现300ms低延迟直播。 主要优势: 10分钟快速部署,支持电商/教育等场景落地 相比Wav2Li

文章图片
#GPU
第二章-AIGC入门-小白也能看懂的AI图像生成指南:从原理到实战(5/36)

AI图像生成技术摘要:AI图像生成技术基于深度学习的GAN和VAE模型,通过生成器与判别器对抗训练或编码器-解码器协作实现图像创作。该技术在艺术创作、商业设计、影视游戏等领域广泛应用,如快速生成概念图、修复照片、创建虚拟场景等。主流工具包括Midjourney、Stable Diffusion等,各具特色。尽管面临伦理、版权和技术准确性等挑战,AI图像生成正推动数字创意产业革新,未来有望与VR/A

文章图片
#人工智能#生成对抗网络
MaaS平台API实战:解锁千万Token福利,体验DeepSeek-R1基础大模型

蓝耘元生代MaaS平台凭借其丰富的模型库和便捷的API调用方式,在AI领域展现出显著优势。文章详细介绍了从注册、获取APIKey到Python和cURL调用的完整流程,并以知识库建立与智能客服为例,展示了API在实际场景中的应用。平台通过Token作为计费单位,提供了免费Token福利,降低了使用门槛,尽管存在模型加载缓慢等不足,但其高效性能和推动多行业数字化转型的潜力不容忽视。未来,平台有望通过

文章图片
#人工智能
探秘AutoGen框架:从入门到实践的全攻略(25/30)

AutoGen 是微软推出的一个开源的多代理对话框架,其核心目的是助力开发者创建基于大型语言模型(LLM)的智能应用。在这个框架中,代理(Agent)是具有特定功能和角色的实体,它们能够通过自然语言进行交流和协作,共同完成复杂的任务。简单来说,就像是组建了一个虚拟的团队,团队中的每个成员(代理)都有自己的专长,通过相互沟通和配合,实现诸如问题解答、任务执行、项目管理等各类目标。

文章图片
#人工智能#AI智能体
    共 461 条
  • 1
  • 2
  • 3
  • 47
  • 请选择