登录社区云,与社区用户共同成长
邀请您加入社区
工具地址Galaxy中国(UseGalaxy.cn)> Graph/Display Data > 箱线图。功能描述这个工具可以绘制出版级箱线图,是在线版的 ggpubr::boxplot 工具。箱线图是一种数据可视化工具,用于展示数据集的分布情况和统计特征。它通过显示数据的中位数、上下四分位数、最小值和最大值,以及异常值,提供了对数据集整体分布的直观认识。箱线图的中央矩形代表数据集的四
都已经安装,出现这个问题是找不到对应的动态库,所以要针对性处理。解决:在~/.bashrc中加入环境变量。覆盖性拷贝,同手动安装cudnn操作。原因:paddel没有找到。根据命令所知,需要的。创建存放动态库的文件夹。
本文提出R-4B模型,通过双模态退火和策略优化(BPO)使多模态大语言模型能自适应决定是否启用思考模式。模型先在涵盖多种主题的双模态数据集上训练,再通过改进的GRPO框架强化模式选择能力。实验显示,R-4B在25个基准测试中表现优异,在多数任务上超越Qwen2.5-VL-7B,在推理任务上达到更大模型Kimi-VL-A3B-Thinking-2506(16B)的水平,同时降低计算成本。该工作解决了
教会你用tushare下载股票数据做量化
原文链接:http://tecdat.cn/?p=24983原文出处:拓端数据部落公众号本文我们超越了 CAPM 的简单线性回归,探索了 Fama French (FF) 股票风险/收益的多因素模型。FF 模型通过回归除市场收益之外的几个变量的投资组合收益来扩展 CAPM。从一般数据科学的角度来看,FF 将 CAPM 的简单线性回归(我们有一个自变量)扩展到多元线性回归(我们有许多自变量)。我们要
原文链接:http://tecdat.cn/?p=26897风险价值 (VaR) 是金融风险管理中使用最广泛的市场风险度量,也被投资组合经理等从业者用来解释未来市场风险(点击文末“阅读原文”获取完整代码数据)。风险价值 (VaR)VaR 可以定义为资产在给定时间段内以概率 θ 超过的市场价值损失。对于收益率 rt 的时间序列,VaRt将是这样的相关视频其中 It-1表示时间 t-1 的信息集。尽管
最优投资组合构造、最小方差、最小VaR、最小CVaR、马科维兹、有效前沿、mean-CVaR。
from vnpy.trader.tqz_extern.tools.pandas_operator.pandas_operator import pandasfrom vnpy.app.tqz_hft_parser_app.hft_parser_path import TQZHftParserPathfrom vnpy.app.tqz_hft_parser_app.tqz_constant imp
原文链接:http://tecdat.cn/?p=22692在过去十年中,人们对高频交易和模型的兴趣成倍增长。虽然我对高频噪音中出现信号的有效性有一些怀疑,但我还是决定使用GARCH模型研究一下收益率的统计模型。与每日和较低频率的收益不同,日内高频数据有某些特殊的特点,使得使用标准的建模方法是无效的。在这篇文章中,我将使用花旗集团2008年1月2日至2008年2月29日期间的1分钟收益率。这个数据
本文利用tushare下载股票数据并找出了跑赢GDP的股票
import pandas as pdimport numpy as np# 创建BOLL线def get_high_low(df: pd.DataFrame) -> list:# 用最高价和最低价构建新的数据,用于显示和判断是否突破BOLL线支撑位、压力位high_low = []for i in df.index:if df['High'][i] > df['阻力线'][i]:hi
Datacamp: Intermediate R
全文下载链接:http://tecdat.cn/?p=25880本文描述了一个模型,该模型解释了交易的聚集到达,并展示了如何将其应用于比特币交易数据。这是很有趣的,原因很多。例如,对于交易来说,能够预测在短期内是否有更多的买入或卖出是非常有用的。另一方面,这样的模型可能有助于理解基本新闻驱动价格与机器人交易员对价格变化的反应之间的区别(点击文末“阅读原文”获取完整代码数据)。介绍订单到达的自激性.
该研究创新性地构建出 “自下而上” 的理论框架,从个体生态位出发,逐步推导种群和物种乃至更高生物组织水平的生态位,为生态学理论的统一以及精准预测生物多样性变化提供了强有力的新工具。这一框架实现了两大重要突破:一方面,该方法能够将种群生态位的统计特征,如宽度、偏度等,细化分解为个体的贡献,从而清晰分辨出个体内变异和个体间变异分别起到的作用;生态位是生态与进化生物学的核心概念。一直以来,学界对个体生态
AI的核心是"数据+模型",但数据造假(比如医疗影像标注篡改)、模型黑盒(比如风控模型无法解释决策依据)、过程不可追溯(比如训练数据来源不明)一直是行业痛点。区块链的"不可篡改、可追溯、多方共识"特性,正好能解决这些问题——用区块链记录数据的"从哪里来、到哪里去",用AI实现"从数据到智能"的价值转化。本文聚焦AI应用架构师的视角,讲解"区块链+AI"融合系统的核心设计逻辑和国产化技术选型区块链与
R 是用于统计计算与绘图的自由开源语言/环境,内置大量统计方法(线/非线性建模、检验、时间序列、分类、聚类等),矩阵代数支持强。适合统计分析与数据科学场景。
通过图形化的方式观察缺失值,可以更直观地理解数据的缺失模式。VIM包提供了多种可视化工具,如aggr()函数和scattmatrixMiss()函数等等。
随着AI技术的不断发展,AI Agent已经成为近年来的热门话题。AI Agent是指能够自主完成任务的智能体,其可以通过与用户的交互来完成任务。当下,AI Agent的应用场景越来越多,比如智能客服、智能助手、智能推荐等。但是,AI Agent的交互协议却没有一个统一的标准。
阿里云盘小白羊版是一款第三方的阿里云盘客户端,支持 Windows、 macOS,扫码登录之后,可满速下载,满速上传,支持预览视频、图片,支持多并发上传、断点续传,支持 115 链、秒传链!阿里云盘小白羊版,拥有强大的网盘存储功能,能够轻松实现高速下载,秒速上传大文件,以及分享秒传链接,满足用户的文件存储需求。而且与官方版相较而言,该版本不仅有着官方版的所有功能,还在其基础上加入了许多独有的功能,
市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景,内容泛泛而谈,最终无法真正解决实际工作中的问题。同时,它们也缺乏针对医药领域的深度结合与讨论。在我们的专栏中,每个章节不仅提供了代码示例,还深入解析了代码背后的逻辑和原理,鼓励学习者理解每一行代码的作用。《用 R 探索医药数据科学》专栏为学习者提供
生命周期分析是一种分析工具,它可帮助人们进行有关如何改变产品或如何设计替代产品方面的环境决策,即由更清洁的工艺制造更清洁的产品。例如,生命周期分析的结果表明,某种产品能耗低,寿命长,不含有毒化学物质,其包装及残余物体积小,从而占用较少的填埋场空间,这就成为我们进行产品选择的依据。生命周期分析 (Life Cycle Analysis, LCA) 是评价一个产品系统生命周期整个阶段——从原材料的提取
数据预处理是数据科学工作流中的重要环节。通过数据清洗、数据集成、数据变换和数据规约等步骤,可以显著提高数据质量,为后续的分析和建模提供坚实基础。在实际应用中,结合具体数据的特点和分析目标,选择合适的数据预处理方法,可以有效提升模型的准确性和稳定性。
上述代码,首先对不同的gamma和cost参数拟合了一个带RBF的SVM的模型。SVM旨在多为空间中找到一个能够将全部样本单元分成两类的最优(超)平面,这一平面应使两类中距离最近的点的间距(margin)尽量大,在间距边界上的点被称为支持向量(support vector,它们决定间距),分割的超平面位于间距的中间。SVM的数据解释化比较复杂,这里不讨论。SVM可用应用于变量数远多于样本单元数的问
R语言和Python在数据分析与机器学习等领域有很多相似的地方,在某些应用场景下不可避免地会涉及到两者的相互调用。这里简单介绍下使用reticulate库进行R调用python的操作。
我们前期推出的《基于R语言结构方程模型》课程通过结构方程原理介绍、结构方程全局和局域估计、模型构建和调整、潜变量分析、复合变量分析及结构方程贝叶斯方法实现等一系列专题的介绍及实际案例讲解及练习,由浅入深地系统介绍结构方程模型的建立、拟合、评估、筛选和结果展示全过程,得到了学员的广泛认可。内容包括:SEM的定义、应用及历史回顾、SEM的基本结构、SEM的估计方法、SEM的路径规则、SEM路径参数的含
在数据科学和编程领域,R语言和Python都是不可或缺的工具。然而,当涉及到网络爬虫时,选择哪种语言可能会让初学者感到困惑。这个问题不仅涉及技术层面的差异,还关系到实际应用中的效率和效果。今天,我们就来深入探讨这个问题,并为你提供一些实用的建议。
train loss与test loss结果分析:train loss 不断下降,test loss不断下降,说明网络仍在学习;train loss 不断下降,test loss趋于不变,说明网络过拟合;train loss 趋于不变,test loss不断下降,说明数据集100%有问题;train loss 趋于不变,test loss趋于不变,说明学习遇到瓶颈,需要减小学习...
R语言是一门应用场景广泛、简单易学的程序语言,APSIM模型开发了许多R语言辅助包,在APSIM模型的气候、土壤、管理措施等数据准备,自动化模拟,参数优化和结果分析上都发挥着重要的作用。APSIM模型有Classic和Next Generation两个系列模型,能模拟几十种农作物、牧草和树木的土壤-植物-大气过程,被广泛应用于精细农业、水肥管理、气候变化、粮食安全、土壤碳周转、环境影响、农业可持续
通过时间序列分析(如ARMA模型),研究者可以动态追踪森林群落的稳定性变化,为生态保护和可持续管理提供数据支持。这种方法的整合为森林生态系统的结构、功能与稳定性研究提供了全新的解决方案,也为未来的生态学研究开辟了更多可能性。
数据分析基础理论知识一、数据分析是什么二、数据分析的作用三、数据分析的具体流程1. 明确目的分析现状分析原因预测未来2. 采集数据3. 数据预处理4. 数据可视化5. 撰写报告一、数据分析是什么数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
数据可视化是通过图形图表的方式来呈现数据,高效清晰地表达数据中包含的信息和分布规律,有助于发现异常值、描述数据趋势以及挖掘相关模型等。特别是相对于大型高维数据集,数据可视化的呈现可使最终结果变得清晰易懂。本文将介绍数据可视化常用的库(模块)Matplotlib、Pandas和Seaborn,使读者能够了解数据可视化的基本思路和方法。散点图from matplotlib import pyplot
市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景,内容泛泛而谈,最终无法真正解决实际工作中的问题。ISOdate() 函数用于创建特定的日期和时间对象,尤其适用于需要指定精确时间点的场景。此示例展示了 ISOdatetime() 的基本用法,它创建了一个指定的日期时间,并返回与 ISOdate()
首先我有一个如图所示的文件。如果在python中读取。而在R中读取的方式如下。
1、https://360ai.org/kettle/2878
【代码】【R语言】神经网络。
相较于传统的硬盘直储,服务器的存储方式为超融合集群存储,天意云生信数据库更是采用异地三备份机制 + RAID冗余存储,数据可靠性高达99.999999999%,比本地硬盘安全等级高10倍。生信分析通常是一个长期、持续的过程,尤其是在分析大规模基因组数据时。可以看出服务器的中总共有629GB的内存,523GB处于可获取状态,这个配置对大家来说肯定绰绰有余,无论运行什么样的单细胞数据应当都不在话下。提
在 MATLAB 中,潜变量模型 (Latent Variable Models, LVMs) 和降维技术被广泛用于复杂数据的分析,例如基因表达数据或其他高维数据集。这些工具有助于揭示隐藏的结构并检测扰动(例如基因敲除或化学处理)在数据中的影响
市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景,内容泛泛而谈,最终无法真正解决实际工作中的问题。该专栏将持续更新,不仅为您提供系统化的学习内容,更致力于成为您掌握最新、最全医药数据科学技术的得力助手。函数提供了灵活的日期时间格式化功能,能够将日期时间对象转换为指定格式的字符串,或将字符串解析为日
这篇文章本来是要被我草草掠过的——字符级层次的卷积分类模型也不是那么难实现,毕竟这篇论文发表的前一年就是koom的TextCNN模型。文章看到一半才想起来,这个是英文域中的文本分类模型,仅仅用a-z26个英文字母就能够完成文本分类?这得好好看看了。...
另外,如果添加“include = FALSE”选项,那么本代码段仅会运行,但是代码和结果都不会出现在输出的文档中。同时,我们还能够设置“eval”“results”“message”和“warning”等参数,以此来选择不同的图形和警告等输出内容。市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景
习惯使用python做爬虫的,反过来使用R语言可能有点不太习惯,正常来说R语言好不好学完全取决于你的学习背景以及任务复杂情况。对于入门学者来说,R语言使用`rvest`+`httr`组合,几行代码就能完成简单爬取(比Python的Scrapy简单得多),R语言数据处理优势明显,爬取后可直接用dplyr/tidyr清洗,小打小闹用R语言完全没问题,如果是企业级大型项目还是有限考虑python,综合成
Date数据分析师的发展路线!从事数据分析相关工作,按职业发展方向大致分为两类。【1】业务路线:业务分析——数据分析师——部门leader——管理高层一般在大中型企业为业务持续增长带来价值,比如提高利润,降低成本,降低风险等。【2】技术路线:数据分析专员——高级数据分析师一般为IT公司,创业型公司。主要从事大数据挖掘,java,人工智能等方面。目前国内外数据分析师处于蓝海行业,并且门槛偏低(没有硬
简单线性回归是一种统计技术,用于显示一个因变量和一个自变量之间的关系。 因变量表示为 Y,而自变量表示为 X。变量 X 和 Y 线性相关。 简单线性回归可用于: (a) 描述一个变量对另一个变量的线性相关性; (b) 根据另一个变量的值预测一个变量; © 修正一个变量对另一个变量的线性相关性。简单线性回归模型的形式为:Yi=β0+β1Xi+εiY_{i}=\beta_{0}+\beta_{1} X
R语言是一种开源编程语言和软件环境,主要用于统计计算和图形表示。它由统计学家和数据矿工广泛使用,用于数据分析、数据挖掘、统计模型构建、数据可视化等。R语言以其强大的数据处理能力、图形功能以及大量可用的包和函数库而闻名。R语言支持跨平台,可以在Windows、Mac OS X和Linux等操作系统上运行。
市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景,内容泛泛而谈,最终无法真正解决实际工作中的问题。在R语言中,最常用的赋值符号是“
r语言
——r语言
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net