
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
前言对于编程语言来说,经常看到有因为各自支持的语言阵营而互怼的,其实根本没那个必要,都只是一种工具而已。当多数主流语言都会使用时也许你就不会有偏见了,本质不过都是用来描述计算机的一个任务,只是每门语言设计时考虑的侧重点不一样而已。大家最好不要停留在语言层面去争执,不如把时间花在计算机实现原理和结构的本质上,这样更能理解编程语言每一行描述的东西在计算机是干什么的。本系列将总结现在IT领域主流的那些.
强化学习强化学习是代理面临的学习问题,它通过与动态环境反复交互试验从而学习到某种行为。它是机器学习的主要学习方法之一,智能体从环境到行为的学习,也就是如何在环境中采取一些列行为,才能使得回报信号函数的值最大,即获得的累积回报最大。现在强化学习与深度学习结合的深度强化学习更加强大。马尔科夫决策过程在理解强化学习之前,我们先了解我们要解决什么样的问题。其实强化学习过程就是优化马尔科夫决策过程...
TextAnalyzerhttps://github.com/sea-boat/TextAnalyzerA text analyzer which is based on machine learning,statistics and dictionaries that can analyze text.So far, it supports hot word extracting, ...
背景:最近在设计一个公司的智能客服系统,通过对现有人工客服语料作为样本,通过训练样本完成整个QA过程或业务办理过程。整体思路AliceBot负责闲聊,这里用了开源的语料,也可以添加语料到DB,基于AIML。AbilityBot主要负责公司业务上的咨询和办理,它提供了不同的能力接口,供外系统交互。predict模块用于预测响应。train模块用于训练客服对话样本。语音转换由第三方语音识别服务
小于15B是小参量,15-70B是中参量,大于70B是大参量。小参量效果较差越来越少人用,大参量效果好但耗资源,所以实际落地还得是中参量,中参量成为主流。开源模型与闭源模型大致的比例是3:7,也就是当前全球开源模型占三成左右。中国基本上主导了开源模型的发展,有实力的厂商包括deepseek、qwen、kimi。提出了一个所谓的灰姑娘玻璃鞋效应,描述了用户粘性与模型选择的现象,早期用户根据自己需求和
从整个人类层面上看,我一直认为竞争和博弈是好事,才能让人类走得更远!然而从国家层面看却关乎着整个民族地位及我们后代的发展,所以我们要积极参与到全球竞争中并取得胜利。这个胜利并非是零和的,而是要通过实力在丛林法则的国际社会中争取更多的国家利益。deepseek虽然只是一个AI大模型产品,但对我们来说却有着非常重大的意义。在技术、金融、商业等具体方面带来了很大的突破,而更高层面上则是给我们的发展带来了
整体情况结合业务数据验证DeepseekR1论文中提到的DeepseekR1核心关键点,包括强化学习(GRPO)、推理能力的蒸馏、SFT+COT(Inference Scaling Laws)验证。实验环境及数据模型:Qwen2.5-0.5B-Instruct场景:sql生成。数据:数千样本算力:一张A100卡SFT 与 RLSFT与RL本质相同,都是监督学习,只是sft有明确的标签,而RL只有明
强化学习强化学习是代理面临的学习问题,它通过与动态环境反复交互试验从而学习到某种行为。它是机器学习的主要学习方法之一,智能体从环境到行为的学习,也就是如何在环境中采取一些列行为,才能使得回报信号函数的值最大,即获得的累积回报最大。现在强化学习与深度学习结合的深度强化学习更加强大。马尔科夫决策过程在理解强化学习之前,我们先了解我们要解决什么样的问题。其实强化学习过程就是优化马尔科夫决策过程...
TextAnalyzerhttps://github.com/sea-boat/TextAnalyzerA text analyzer which is based on machine learning,statistics and dictionaries that can analyze text.So far, it supports hot word extracting, ...
基本情况l AWS覆盖全世界12个国家区域1. 每个区域都对应着世界上的一个物理位置,每个位置都有弹性计算云提供多个可用区域(Availability Zones),这些区域包含北美、南美、欧洲、中东、非洲、亚太等地区。2. 每个可用区域(AZ)实质上是单个数据中心,尽管它可由多个数据中心构造。3. 每个可用区域都拥有很强的隔离性,他们各自拥有独立的电源和网络。4. 可用区域之间只能通过低延迟网络







