简介
非计算机专业出身人士,但于2009年毅然投身IT行业。迄今,拥有15年的开发经验以及10年的项目管理经验。曾先后参与金融、政企、互联网等多个行业领域的数十个项目。对分布式架构、微服务技术以及大数据领域的知识掌握娴熟。当前,致力于人工智能(AI)方向的深入探索,所负责的项目已顺利完成大语言模型和算法的备案工作。
擅长的技术栈
可提供的服务
开发资源,技术咨询
开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Gradio
使用Gradio快速体验Qwen2.5-7B-Instruct与vllm集成推理的效果。
开源模型应用落地-LangChain实用小技巧-检索器-ContextualCompressionRetriever(十四)
使用ContextualCompressionRetriever提高检索系统在处理大量文本数据时的效率和相关性
开源模型应用落地-FastAPI-助力模型交互-WebSocket篇(五)
使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。
开源模型应用落地-FastAPI-助力模型交互-WebSocket篇(二)
使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。
开源模型应用落地-FastAPI-助力模型交互-WebSocket篇(一)
使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。
开源模型应用落地-FastAPI-助力模型交互-进阶篇-生命周期事件(一)
通过生命周期事件,可以更好地管理应用的整个生命周期中的资源和操作,确保资源的正确初始化和释放,提高应用的性能、可靠性和可维护性。
开源模型应用落地-chatglm3-6b-streamlit-入门篇(八)
使用streamlit搭建AI交互界面
开源模型应用落地-FastAPI-助力模型交互-WebSocket篇(六)
使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。
开源模型应用落地-CodeQwen模型小试-SQL专家测试(二)
使用CodeQwen1.5-7B-Chat模型,帮助开发人员获得高效、准确和个性化的代码支持
开源模型应用落地-工具使用篇-JMeter(一)
使用JMeter工具压测AI服务链路,及时发现潜在的性能瓶颈