logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

揭开deepseek的秘密,跟着我的新书学习理解AI原理!

从整个人类层面上看,我一直认为竞争和博弈是好事,才能让人类走得更远!然而从国家层面看却关乎着整个民族地位及我们后代的发展,所以我们要积极参与到全球竞争中并取得胜利。这个胜利并非是零和的,而是要通过实力在丛林法则的国际社会中争取更多的国家利益。deepseek虽然只是一个AI大模型产品,但对我们来说却有着非常重大的意义。在技术、金融、商业等具体方面带来了很大的突破,而更高层面上则是给我们的发展带来了

#人工智能#学习
DeepseekR1关键点复现验证及思考

整体情况结合业务数据验证DeepseekR1论文中提到的DeepseekR1核心关键点,包括强化学习(GRPO)、推理能力的蒸馏、SFT+COT(Inference Scaling Laws)验证。实验环境及数据模型:Qwen2.5-0.5B-Instruct场景:sql生成。数据:数千样本算力:一张A100卡SFT 与 RLSFT与RL本质相同,都是监督学习,只是sft有明确的标签,而RL只有明

#人工智能
让机器玩游戏的强化学习(附github)

强化学习强化学习是代理面临的学习问题,它通过与动态环境反复交互试验从而学习到某种行为。它是机器学习的主要学习方法之一,智能体从环境到行为的学习,也就是如何在环境中采取一些列行为,才能使得回报信号函数的值最大,即获得的累积回报最大。现在强化学习与深度学习结合的深度强化学习更加强大。马尔科夫决策过程在理解强化学习之前,我们先了解我们要解决什么样的问题。其实强化学习过程就是优化马尔科夫决策过程...

#人工智能#机器学习
我的开源项目汇总(机器&深度学习、NLP、网络IO、AIML、mysql协议、chatbot)

TextAnalyzerhttps://github.com/sea-boat/TextAnalyzerA text analyzer which is based on machine learning,statistics and dictionaries that can analyze text.So far, it supports hot word extracting, ...

#开源#机器学习#nlp +1
如何搭建千万级别用户的应用系统

基本情况l AWS覆盖全世界12个国家区域1. 每个区域都对应着世界上的一个物理位置,每个位置都有弹性计算云提供多个可用区域(Availability Zones),这些区域包含北美、南美、欧洲、中东、非洲、亚太等地区。2. 每个可用区域(AZ)实质上是单个数据中心,尽管它可由多个数据中心构造。3. 每个可用区域都拥有很强的隔离性,他们各自拥有独立的电源和网络。4. 可用区域之间只能通过低延迟网络

#架构
如何从大量数据中找出异常值

前言机器学习中数据预处理阶段,首先要考虑的就是将数据集中的异常值找出来,然后再做额外处理。当然,异常值的处理并不存在什么银弹,只能具体情况具体分析再根据效果选择处理方法。直方图看看数据集直方图也许能看出点端倪,比如下面这个图,下方的是原始数据集,上面的是对应直方图,可以看到大多数都分布在11000左边,它的右边存在一些分布,这些分布极少的点很可能就是异常点。sigma原则一些简单的场景...

#机器学习
TensorFlow实现seq2seq

前言前面在《深度学习的seq2seq模型》文章中已经介绍了seq2seq结构及其原理,接下去这篇文章将尝试使用TensorFlow来实现一个seq2seq网络结构,该例子能通过训练给定的训练集实现输入某个序列输出某个序列,其中输入序列和输出序列相同,这里选择使用LSTM模型。训练样本集为方便起见这里使用随机生成的序列作为样本,序列的长度也是随机的且在指定的范围内。LSTM机制原理关于LSTM机制原

#深度学习#tensorflow#lstm
Java使用agent实现main方法之前

创建Agent项目PreMainExecutor 类,在main方法之前执行此方法public class PreMainExecutor {public static void premain(String agentOps, Instrumentation inst){System.out.println("premain execute..........");

#java
Java内存模型

在多核时代,如何提高CPU的性能成为了一个永恒的话题,而这个话题的讨论主要就是如何定义一个高性能的内存模型,内存模型用于定义处理器的各层缓存与共享内存的同步机制及线程和内存交互的规则。 Java的世界也有属于它自己的内存模型,Java内存模型,即Java Memory Model,简称JMM。由于Java被定义成一种跨平台的语言,所以在内存的描述上面也要能是跨平台的,Java虚拟机试图定义一种统一

#java
关于Class文件

什么是Class文件Java人对class文件肯定很熟悉了,它是Java源码编译后的产物。JVM运行时负责加载class文件,并根据class定义的执行逻辑运行。java为了将硬件底层的差异屏蔽掉,引入了Java虚拟机(JVM)并将硬件差异处理都放到JVM中,所以可以编译出统一的二进制文件——class。所以只要通过编译器编译成规范的class文件都可以在JVM上面运行,像现在很多其他语言其实都是

#jvm#java#虚拟机
    共 22 条
  • 1
  • 2
  • 3
  • 请选择