logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

deepseek爆火,kimi危险了

Kimi创始人杨植麟是典型的天才,学术方面才华横溢,谷歌学术他引3W+,担任中国最好的计算机学院——清华大学交叉信息研究院的助理教授,逆天开局。DeepSeek创始人梁文锋没有博士学位,独自探索量化交易,完成0-1的散户赚钱过程,以及1-100的机构创建、盈利、壮大的过程,跑通了技术、管理的全流程链路。两者都是典型的天才,DeepSeek具备自我造血能力,能够更加纯粹的探索技术,干翻openai。

#人工智能#AIGC
DeepSeek上线类o1模型——DeepSeek-R1-Lite

2024年11月20日,DeepSeek全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。可登录官方网页 (chat.deepseek.com),开启与 R1-Lite 的对话体验。该模型采用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果,

文章图片
#人工智能#语言模型#深度学习
Qwen2.5快开源了!!!

在LMSYS中可测试,路径见 https://lmarena.ai/估计又是对某某闭源模型的一场血雨腥风。

文章图片
#python#transformer
到底了