登录社区云,与社区用户共同成长
邀请您加入社区
AI 开发工作者 Python 语言必须掌握的知识总结
目前,移动云既能以弹性计算产品与智算平台为用户部署、应用AI大模型提供算力与工具支撑,也能通过云电脑为用户直接提供AI应用。通过接入DeepSeek(R1满血版)大模型,移动云电脑支持用户一键设置基于DeepSeek的通用问答或个人知识库问答,获取智能分析总结、自动续写优化、跨语言翻译、代码生成纠错等AI功能,同时移动云电脑还可提供包括办公、教育、医疗、学习等多个类别数十款智能体应用,能够全面满足
在金融风控场景中,需要计算账户交易金额的截尾均值(剔除最高/最低值后的平均值)。通过apply()某银行反欺诈系统应用后,误报率降低37%,因截尾均值有效过滤了单笔大额交易造成的噪声。随着5G+AIoT时代到来,时间序列数据量正以每年300%的速度增长。Pandas的滑动窗口、重采样和趋势分析工具链,正在从数据分析领域向实时决策系统延伸。某跨国企业已将Pandas与Flink集成,构建了每秒处理1
中间件(Middleware)是 LangChain 1.0 的重大更新点之一:允许开发者在 Agent 执行过程中,通过“钩子”介入并改写行为,从而更细粒度控制 Agent 的每个环节。传统 React Agent 核心循环图加入中间件后的流程图直觉理解:原本 Agent 是“固定流程”;加入中间件后,你可以在关键阶段插入逻辑(监控、改消息、换模型、拦截工具、重试/降级等)。Middleware
本文介绍了LangChain 1.0的核心升级与功能特性。LangChain从"拼装库"转型为"Agent Runtime"入口,底层基于LangGraph图式执行引擎,提供统一模型抽象、标准化消息块和可插拔中间件。三大里程碑能力包括:统一Agent创建入口、标准化内容块和API精简。中间件系统支持HITL、消息压缩和动态模型路由等生产级功能。文章还对比了L
在使用pandas进行数据类型转换(astype)时,若目标列包含NaN或inf,直接转为整数会触发IntCastingNaNError错误。本文提出三种解决方案: 使用可空整型Int64:通过.astype('Int64')保留缺失值; 填充缺失值:用默认值(如0或最大值+1)填充后转为标准整型; 局部处理:先dropna转换有效值,再与原索引对齐。 最佳实践:优先选择Int64类型,业务场景明
本文探讨了NumPy和Pandas在AI测试中的关键作用。NumPy通过高效数组运算能力,解决了图像测试数据生成、噪声注入等底层数据处理难题,其向量化运算相比传统循环可提升数十倍效率。文章通过ImageTestDataGenerator类展示了高斯噪声生成、遮挡测试和对抗样本生成三大核心功能的具体实现。Pandas则凭借强大的数据结构和处理函数,能有效应对AI测试中高维度、大数据量的处理需求,实现
我将基于之前的Pandas积木设计,为您创建一个完整的MCP工具项目。这个工具让LLM只需通过简单的参数配置就能执行复杂的数据分析任务。
仅需3步,Cherry Studio+硅基流动,搭建本地小助手,让DeepSeek R1发挥最大实力,彻底告别“服务器繁忙”!
view()仅适用于连续张量,非连续需先;返回视图,修改会影响原张量;bmm无广播,批量矩阵相乘需保证batch数一致;dot对高维张量会展平,优先用matmul替代。
针对开发者痛恨写文档的痛点,介绍了一套基于国产大模型的API文档生成指令。该指令能将非结构化的接口描述自动转化为符合RESTful标准的专业文档,大幅降低协作成本,消除“以后补文档”的技术债务。
在没有命令的情况下使用 discord.py 发送消息,首先需要确保你已经安装了 discord.py 库,并在你的机器上运行了一个 Discord 客户端(如 discord-bot)。1. **自动回复**:你可以编写一个脚本,当机器人接收到特定关键词或指令时,自动回复特定的消息。请注意,虽然这些场景在 Discord 聊天中可能不太常见,但在其他聊天平台如 Telegram 或微信群组等也有
替换 Sandbox 镜像为可扩展的版本在中声明依赖删除旧镜像并重新启动这样一来,Dify 的 Sandbox 环境就能像常规 Python 环境一样自由使用第三方库了 🚀有问题欢迎评论区留言!🤞😉。
NumPy 和 Pandas 是 Python 数据科学领域最核心的两个库,分别专注于数值计算和数据分析,二者常结合使用以高效处理结构化和非结构化数据。NumPy(Numerical Python)是 Python 科学计算的基础库,提供了高性能的多维数组对象和数学函数,是 Pandas 等高级库的底层依赖。
本文介绍了在openEuler集群中使用Chrony实现高精度时间同步的实践方案。通过三节点集群架构(1主2从),详细展示了从环境准备、网络配置到Chrony服务部署的全过程。重点包括:主节点配置为时间服务器并连接外部NTP源,从节点指向主节点同步;使用chronyc工具验证微秒级同步精度;分析同步状态关键参数。该方案解决了分布式系统中时间偏差导致的一致性问题,适用于对时序要求严格的数据库、AI训
pd.DataFrame(data,index,columns,dtype):创建一个DataFrame。pd.Series(data,index,dtype):创建一个Series。df.head(n):查看DataFrame前n行,默认为前5行。df.tail(n):查看DataFrame后n行,默认为后5行。df.index:获取DataFrame的索引。df.columns:获取DgtgF
在这次实践中,我在 openEuler 上完整体验了从环境搭建到数据分析、再到可视化的整个流程。通过这次案例,我有几个深刻的感受:1.环境搭建非常简便。openEuler 提供了稳定的系统管理工具和包管理机制,使得 Python3 和常用数据分析库可以快速安装并使用,无需复杂配置。这让我能够迅速进入数据分析的实际工作,而不被环境问题拖延。2.数据处理效率显著提升。Pandas 提供了强大的数据读取
在数据爆炸时代,本地大模型(LocalLLMs)与Pandas结合可高效处理百万级数据集,实现自动化分析报告生成。通过Pandas提取核心指标(如分布、四分位数等),再经本地部署的Mistral等模型转化为结构化Markdown/HTML报告,解决了手动分析效率低、云端数据泄露风险等问题。实战案例展示了从MBA招生数据自动提取关键指标(GPA、录取率等)到生成专业报告的全流程。进阶技巧包括品牌定制
SQLite是一个轻量级的嵌入式关系数据库,它不需要独立的服务器进程,将数据存储在单一的磁盘文件中。Python内置了sqlite3模块,使得我们可以非常方便地操作SQLite数据库。同时,pandas作为Python数据分析的重要工具,也提供了与SQLite数据库交互的便捷方法。本文将详细介绍如何使用Python调用SQLite数据库,以及pandas与SQLite相关的API。
怎么用python手撕一个深度神经网络来解决分类问题?要求不调用其他核心库如tf,sk等,只用numpy、pandas库?这篇文章会告诉你答案!!
摘要:本文对比分析了Java NIO(同步非阻塞)与AIO(异步非阻塞)的核心差异。NIO通过Selector轮询I/O状态,需应用程序主动读写数据,适合高并发轻量级场景(如聊天服务器);AIO则由操作系统完成I/O后回调通知,适合大文件传输等耗时操作。关键区别在于NIO需应用层处理就绪事件(同步),而AIO完全依赖内核异步执行。选择时需考虑场景需求:NIO优势在于高并发连接管理,AIO更擅长重型
本文对比了Java网络编程中的三种I/O模型:BIO、NIO和AIO。BIO是同步阻塞模型,适合连接数少的场景;NIO采用同步非阻塞和多路复用机制,适合高并发连接;AIO是异步非阻塞模型,性能最高但实现复杂。文章通过餐厅服务员的比喻形象说明三者的工作原理,并给出选型建议:BIO适合简单架构,NIO是主流高并发选择,AIO适用于长连接重量级操作。最后强调技术选型需结合具体场景需求,帮助开发者做出合理
在3D目标检测中,可以大致分为基于图像、基于点云和基于多模态融合的三种方法。而基于点云处理的3D目标检测中,如何有效处理点云数据信息是其中的重点。常见的处理点云的方法有两种,一种为将无序的点云处理成有规则的体素或者柱体(voxel or pillar)等来进行处理,被称为Voxel-Based,另一种则是直接在原始点云上进行操作的Point-Based方法。本文主要介绍如何Point-Based中
在深度学习模型部署中,跨框架兼容性是一个常见挑战。不同框架(如 PyTorch、TensorFlow)训练出的模型难以直接互操作,导致部署效率低下。ONNX(Open Neural Network Exchange)作为一种开放格式,通过标准化模型表示来解决这一问题。DeepSeek 作为一个典型模型,可以通过 ONNX 转换和优化实现无缝部署。下面,我将逐步解释如何操作,确保过程清晰可靠。
本文详细介绍了如何使用PyTorch框架实现鸢尾花分类任务,涵盖了从环境搭建到模型训练的全过程。首先,创建并配置了Python环境,安装了必要的库,并检查了CUDA环境以确保GPU加速的可用性。接着,加载并预处理了经典的鸢尾花数据集,将其转换为PyTorch张量。然后,定义了一个简单的全连接神经网络模型,并选择了交叉熵损失函数和随机梯度下降优化器。在模型训练部分,通过20000轮的迭代优化,损失值
摘要:自适应测试系统正推动软件测试领域向智能化转型。该系统具备环境感知、智能用例进化和全链路自治三大特征,通过数据驱动决策引擎和微服务架构实现动态测试策略调整,测试效率提升40%以上。落地需克服组织能力升级、数据治理等挑战,未来将与AI深度融合,实现从经验依赖到数据驱动的范式变革。测试人员需掌握数据分析等新技能以适应这一趋势。(149字)
企业数字化转型已进入深水区,跨端开发正从技术选项升级为战略必须。通过合理的技术选型、深度的性能优化和系统的知识产权布局,企业可构建"一次开发,多端运行,全场景覆盖"的数字化能力体系。建议技术团队重点关注Flutter 3.0的WebAssembly支持、鸿蒙Next的分布式升级等技术动态,持续提升跨端开发的工程化水平。
本文汇总了Pandas数据分析中26个常用函数,包括数据查看(df.head/tail/sample)、信息获取(shape/columns/dtypes)、统计描述(describe/quantile/skew)、聚合计算(mean/median/mode)等核心功能,并提供了具体使用示例。这些函数涵盖了数据探索的基础操作,如查看数据首尾行、获取行列信息、计算统计指标等,是进行数据预处理和分析的
在上一篇文章中,我们学习了Python科学计算的核心库Numpy,在本章中我们将学习机器学习中负责数据处理和分析的Pandas库。Pandas是一个用Python编写的数据分析库,可以轻松处理数百万行数据,是AI工程师最常用的工具。
数据清洗是数据分析/AI建模的基础步骤,直接影响后续结果的准确性。结合上篇文章对于Pandas基础操作的讲解,今天使用Hugging Face可获取的经典公开数据集Titanic,实战讲解最常用的清洗操作,适合初学者快速上手。DataFrame是Pandas的核心数据结构,可理解为“带标签的表格”;缺失值处理优先选“填充”(按字段类型选中位数/均值/特殊值),仅缺失极少时选“删除”;重复值处理用检
pandas
——pandas
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net