
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
震惊,新手小白从零开始认识 FunASR !
FunASR是阿里巴巴达摩院推出的开源语音识别工具集,采用端到端模型(Paraformer)实现语音到文本的直接转换,简化传统ASR的多步流程。其工作流程分为音频预处理、特征提取、模型预测和后处理四个环节,支持离线长音频、实时转写和方言识别等场景。相比闭源ASR,FunASR具有本地部署、免费开源、可自定义等优势,适用于隐私敏感领域。该工具通过模块化设计和工程化优化,降低了语音识别技术的使用门槛,
总结大模型算法工程师的一些基础知识
基础层:掌握经典机器学习(模型 + 流程)、深度学习基础(CNN/RNN);核心层:吃透 Transformer、注意力机制、预训练 - 微调范式;应用层:实践 NLP 任务(NER、翻译、QA)、多模态融合;工程层:学习 MLOps(训练、部署、监控)、模型安全对齐。大模型技术仍在快速发展,建议结合实际项目(如微调小模型做客服)深化理解,持续跟进前沿架构(如 SSMs、MoE),逐步构建自己的技
看完后认识RAG的原理,核心思想,工作流程!!!
相结合的人工智能技术。它的核心思想是:在让大模型回答问题之前,先从一个大型、私有的知识库中 “查找” 相关的参考资料,然后让模型基于这些找到的 “证据” 来生成最终答案。这个阶段是一次性的 “基建工程”,目的是把原始文档转换成方便快速检索的格式。分割策略对 RAG 性能影响巨大。如何衡量一个 RAG 系统的好坏?这是用户与系统交互的实时过程。你可以把它想象成一个。
到底了







