开源技术探险家个人主页

@qq839019311

开源技术探险家

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

广州

2022-10-09 10:12:16 加入 DevPress

简介

非计算机专业出身人士，但于2009年毅然投身IT行业。迄今，拥有15年的开发经验以及10年的项目管理经验。曾先后参与金融、政企、互联网等多个行业领域的数十个项目。对分布式架构、微服务技术以及大数据领域的知识掌握娴熟。当前，致力于人工智能（AI）方向的深入探索，所负责的项目已顺利完成大语言模型和算法的备案工作。

擅长的技术栈

人工智能大数据微服务技术

可提供的服务

开发资源，技术咨询

开源模型应用落地-从源代码构建和运行vLLM-以满足您更高的需求

通过vLLM源码构建Docker镜像，提升了构建的灵活性与安全性，同时也优化了研发与部署的效率。

文章图片

#深度学习 #AIGC

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现离线推理-CPU版本

使用CPU将Qwen2.5-7B-Instruct模型与vLLM框架进行有效整合（使用vLLM框架，能为模型推理提供强有力的支持，使得在CPU上执行的模型不仅能保持较高的准确率，还能在资源有限的条件下，实现快速响应，充分释放潜在价值）

文章图片

#深度学习 #自然语言处理 #语言模型

开源模型应用落地-工具使用篇-Ollama（六）

Ollama集成QWen1.5系列模型，全网唯一，绝非搬运。

文章图片

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现离线推理-CPU版本

使用CPU将Qwen2.5-7B-Instruct模型与vLLM框架进行有效整合（使用vLLM框架，能为模型推理提供强有力的支持，使得在CPU上执行的模型不仅能保持较高的准确率，还能在资源有限的条件下，实现快速响应，充分释放潜在价值）

文章图片

#深度学习 #自然语言处理 #语言模型

开源模型应用落地-Qwen2.5-7B-Instruct与TGI实现推理加速

集成 Hugging Face的TGI框架实现模型推理加速

文章图片

#深度学习 #自然语言处理 #语言模型

开源模型应用落地-Qwen2.5-Coder模型小试-码海无涯（二）

使用Qwen2.5-Coder-7B-Instruct模型，探索更多使用场景

文章图片

#深度学习 #自然语言处理 #语言模型

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Gradio

使用Gradio快速体验Qwen2.5-7B-Instruct与vllm集成推理的效果。

文章图片

#深度学习 #自然语言处理 #语言模型

开源模型应用落地-Qwen2.5-Coder模型小试-码无止境（一）

使用Qwen2.5-Coder-7B-Instruct模型，帮助开发人员获得高效、准确和个性化的代码支持

文章图片

#深度学习 #自然语言处理 #语言模型

开源模型应用落地-FastAPI-助力模型交互-WebSocket篇（五）

使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。

文章图片

#websocket #语言模型 #深度学习 +1

开源模型应用落地-FastAPI-助力模型交互-WebSocket篇（二）

使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。

文章图片

#fastapi #websocket #语言模型 +1

共 25 条

1
2
3

请选择