johnteller 个人主页

@johnteller

johnteller

2022-12-28 12:01:05 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

vscode+ssh免密登录总结（个人用）

win11-vscode免密登录教程

文章图片

#vscode #ssh #服务器

o3-mini与deepseek-r1的弹球游戏代码对比分析

对比了deepseek-r1与o3-mini在弹球问题这一个case中的代码层面上的具体差别

文章图片

#游戏 #语言模型 #python +1

vllm+llama模型出现＜|eot_id|＞并且一直输出至最大长度问题的解决方案

本人在使用vllm的openai接口部署llama3以及llama2时，出现了下面的模型输出结果：可以看到上面的输出存在两点问题：1. 输出中包含模型的eos_token_id信息；2. 模型接着上一段开始自行组织多轮对话直到max_tokens.本文提供了解决方案

文章图片

#语言模型 #自然语言处理

o3-mini与deepseek-r1的弹球游戏代码对比分析

对比了deepseek-r1与o3-mini在弹球问题这一个case中的代码层面上的具体差别

文章图片

#游戏 #语言模型 #python +1

vllm+llama模型出现＜|eot_id|＞并且一直输出至最大长度问题的解决方案

本人在使用vllm的openai接口部署llama3以及llama2时，出现了下面的模型输出结果：可以看到上面的输出存在两点问题：1. 输出中包含模型的eos_token_id信息；2. 模型接着上一段开始自行组织多轮对话直到max_tokens.本文提供了解决方案

文章图片

#语言模型 #自然语言处理

vllm+llama模型出现＜|eot_id|＞并且一直输出至最大长度问题的解决方案

本人在使用vllm的openai接口部署llama3以及llama2时，出现了下面的模型输出结果：可以看到上面的输出存在两点问题：1. 输出中包含模型的eos_token_id信息；2. 模型接着上一段开始自行组织多轮对话直到max_tokens.本文提供了解决方案

文章图片

#语言模型 #自然语言处理

o3-mini与deepseek-r1的弹球游戏代码对比分析

对比了deepseek-r1与o3-mini在弹球问题这一个case中的代码层面上的具体差别

文章图片

#游戏 #语言模型 #python +1

到底了