logo
publist
写文章

简介

非计算机专业出身人士,但于2009年毅然投身IT行业。迄今,拥有15年的开发经验以及10年的项目管理经验。曾先后参与金融、政企、互联网等多个行业领域的数十个项目。对分布式架构、微服务技术以及大数据领域的知识掌握娴熟。当前,致力于人工智能(AI)方向的深入探索,所负责的项目已顺利完成大语言模型和算法的备案工作。

擅长的技术栈

人工智能大数据微服务技术

可提供的服务

开发资源,技术咨询

开源模型应用落地-从源代码构建和运行vLLM-以满足您更高的需求

通过vLLM源码构建Docker镜像,提升了构建的灵活性与安全性,同时也优化了研发与部署的效率。

文章图片
#深度学习#AIGC
开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现离线推理-CPU版本

使用CPU将Qwen2.5-7B-Instruct模型与vLLM框架进行有效整合(使用vLLM框架,能为模型推理提供强有力的支持,使得在CPU上执行的模型不仅能保持较高的准确率,还能在资源有限的条件下,实现快速响应,充分释放潜在价值)

文章图片
#深度学习#自然语言处理#语言模型
开源模型应用落地-工具使用篇-Ollama(六)

Ollama集成QWen1.5系列模型,全网唯一,绝非搬运。

文章图片
#深度学习
开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现离线推理-CPU版本

使用CPU将Qwen2.5-7B-Instruct模型与vLLM框架进行有效整合(使用vLLM框架,能为模型推理提供强有力的支持,使得在CPU上执行的模型不仅能保持较高的准确率,还能在资源有限的条件下,实现快速响应,充分释放潜在价值)

文章图片
#深度学习#自然语言处理#语言模型
开源模型应用落地-Qwen2.5-Coder模型小试-码无止境(一)

使用Qwen2.5-Coder-7B-Instruct模型,帮助开发人员获得高效、准确和个性化的代码支持

文章图片
#深度学习#自然语言处理#语言模型
开源模型应用落地-FastAPI-助力模型交互-WebSocket篇(五)

使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。

文章图片
#websocket#语言模型#深度学习 +1
开源模型应用落地-FastAPI-助力模型交互-WebSocket篇(二)

使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。

文章图片
#fastapi#websocket#语言模型 +1
    共 25 条
  • 1
  • 2
  • 3
  • 请选择