登录社区云,与社区用户共同成长
邀请您加入社区
(将长历史总结成要点)、
本文介绍了如何通过 responses-proxy 将第三方 OpenAI 兼容服务 agnes-20-flash 接入原生 Codex。由于 Codex 默认使用 Responses API,而多数第三方服务仅支持 Chat Completions API,需要通过代理进行协议转换。文章详细说明了配置步骤,包括设置代理服务、修改 Codex 配置文件等,并推荐了更稳定的中转服务满意AI。方案保持
我们为什么需要用PyTorch,它到底香在哪里?又怎么用?看完这篇文章,相信你会有答案~本文来自:https://zhuanlan.zhihu.com/p/271659551读完这篇文...
戳我,查看GAN的系列专辑~!作者丨xiaopl@知乎 编辑来源 极市平台来源丨https://zhuanlan.zhihu.com/p/69294347PyTorch 作为一个深度学...
作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。对于没有安装过Ollama的朋友,可以直接进入Ollama的官网: https://ollama.com/ 进行安装和下载。如果要下载对应的模型,可以ollama pull llama3从Ollama的模型注册表中拉取指定的
AI不会替代你的学习过程,但它可以让同样的时间产出更多的成果。
想象一下这个场景:你做了一个画面很精美的 3D 游戏,但手机性能有限,跑不了原生高分辨率。你有两个选择:一是降低分辨率让游戏流畅运行,但画面会模糊;二是硬扛高分辨率,但帧率惨不忍睹。有没有第三种选择?有——用神经网络超分。简单说就是:你用低分辨率渲染(性能好),然后通过 AI 算法把画面"放大"到高分辨率。因为 AI 能够智能地补充细节,所以最终效果比传统的双线性插值好得多。这就是 XEngine
摘要: 2015–2025年,智能座舱从传统驾驶舱(机械仪表+单屏)跃迁为全域多屏、大模型AI助手、量子安全的情感智能空间。中国从跟随特斯拉到全球领跑(华为、阿里、比亚迪等主导),渗透率从<5%升至>90%,市场规模达万亿级。2015–2018年为单屏启蒙期;2019–2022年多屏+AI助手崛起;2023–2025年进入大模型原生+情感交互时代,实现意图直驱与情感陪伴。中国技术(鸿蒙
用 AMD Radeon RX 7900 XTX 单卡,以 Qwen3-4B 为底座、LoRA 做参数高效微调,训练一个《绝区零》仪玄角色助手,再通过 vLLM 部署推理,配合 ChromaDB 向量检索和防 OOC 校验器,实现风格还原 + 知识准确 + 人设稳定。本文记录从环境配置、数据集构建、LoRA 微调、vLLM 部署到踩坑填坑的全流程,AMD ROCm 生态实战可复现。
本文介绍了MindSpore多模态大模型训练与微调以及openEuler内核开发两个技术方向。在MindSpore部分,详细说明了环境配置、CLIP模型微调代码实现,包括数据集处理、训练配置等核心步骤,并强调其支持国产硬件和高效训练的优势。openEuler部分则从开发准备、内核模块编写、编译测试到补丁提交完整流程,指导开发者参与开源贡献。这两个方向分别覆盖AI大模型和国产操作系统核心领域,既能提
顾名思义,这个方法的输入,不是原始测序矩阵,而是两大类“知识型输入”。作者主要做的就是 LLM + 外部专家知识来进行核心基因筛选,虽然并不涉及方法开发,但好歹是个新鲜的流程,正文中称为分层知识引导的风险基因识别 LLM 方法(HKLLM-RG)。除了上面的内容以外,与大语言模型对话的提示词(Prompt)以及具体的分析也是有设计的好吧。• 前列腺癌专门知识层,来自前列腺癌研究,覆盖流行病学、发病
一换到没见过的全新场景,或是进入长交互、多工具、高压力的智能体环境,模型就很容易出现行为漂移、安全违规、泄露信息、伪装对齐等泛化失效问题——结果,即便微调数据完全相同,但两组模型在艺术、交通、时尚等全新场景里,依然会按自动沿着自己被教的价值观去判断。但这种对齐方法只教行为,不教原理,模型只是机械模仿,根本不懂规则背后的逻辑,泛化能力严重不足。加入MSM后,两款模型的失准率直接从68%、54%骤降到
会译插件的核心是以Transformer NMT为统一翻译引擎,针对网页、PDF、视频等不同媒介的特性,分别耦合DOM解析、PDF格式解析、语音识别与字幕处理等专项技术,从而构建起一个覆盖多场景的、无缝的翻译应用生态。其技术路径代表了当前AI翻译工具向。
负荷预测在电力系统运行、能源管理等诸多领域起着关键作用。准确的负荷预测有助于合理安排发电计划、优化电网调度,进而提升能源利用效率并降低成本。回声神经网络(ESN)作为一种新型的递归神经网络,在处理时间序列数据方面展现出独特优势。然而,其性能受初始权重、储备池参数等因素影响。金枪鱼优化算法(TSO)模拟金枪鱼的捕食、游动等行为,具有强大的全局搜索能力。本文探讨如何利用 TSO 优化 ESN,实现高精
高维等变性的需求。然而,越来越多的科学问题天然具有高维空间高熵合金设计:成分空间可达 10~20 维,且元素置换具有对称性。宇宙学:星系分布的红移-位置联合空间可视为 4 维,CMB 数据需球谐分析至 (l\sim3000)。生物信息学:基因表达谱的维度可达数万,样本间的相关矩阵具有潜在置换对称性。核聚变等离子体:控制线圈电流构成高维矢量,其响应需满足托卡马克的轴对称性。在这些场景下,传统 3D
从数学角度看,神经网络本质上是一个超级复杂的非线性函数YfXY = f(X)YfX。输入:数据(如图像像素、文本向量)。输出:预测结果(如分类概率、数值)。内部:成千上万个参数(权重和偏置),通过训练不断调整,试图找到一组最佳参数,使得输入XXX能准确映射到输出YYY。
不知道有没有和我当初一样的朋友,刚接触深度学习的时候,信心满满翻开《深度学习》花书,刚看了两章神经元,满页的偏导、矩阵乘法直接给我干懵了。合上书脑子里就一个想法:神经网络这玩意儿是不是给天才准备的?我这种普通人是不是学不会?后来被逼着我从0写一个简单的全连接神经网络做手写数字识别,写完调通跑通准确率出来那一瞬间,我突然发现:原来神经网络的原理根本没那么复杂!所有复杂的推导,本质上都是为了支撑几个非
随着生成式AI技术的快速普及,AI开发不再是专业数据中心的专属领域,越来越多的个人开发者、学生和技术爱好者都希望在本地搭建属于自己的AI工作站。然而,市场上主流的AI计算硬件价格高昂,尤其是专业级计算卡的成本往往让预算敏感型用户望而却步。本报告聚焦于基于AMD Radeon系列消费级显卡的高性价比AI工作站搭建方案,系统介绍从单卡入门到多卡阵列的全流程配置方法,以及如何在保障游戏体验的同时兼顾AI
本文提出了一种基于Transformer编码器的风电功率多变量时间序列预测方法。该方法通过融合风速、风向、温度等多维气象数据,利用自注意力机制捕捉变量间的复杂关系,实现风电功率的高精度预测。项目采用PyTorch框架实现,包含数据预处理、滑动窗口构建、位置编码、Transformer编码器堆叠等核心模块,支持多步预测输出。实验结果表明,该方法在均方根误差(XMSE)、平均绝对误差(MAE)等指标上
本文介绍了一个基于DQN深度强化学习算法的无人机三维路径规划MATLAB实现方案。项目包含完整代码(含详细注释和简洁版本)、模拟数据生成、模型构建、训练评估等功能,具有以下特点: 采用优先经验回放(PER)和Dueling DQN架构,支持参数设置、训练暂停/继续和实时可视化 三维环境建模包含障碍物避障、路径优化等核心功能,通过奖励函数设计实现安全导航 提供8种评估图表,包括三维路径可视化、训练曲
摘要:本项目提出了一种基于经验小波变换(EWT)和N-BEATS神经网络的中短期天气预测方法。EWT用于自适应分解气象信号,提取多尺度特征;N-BEATS网络则对每个模态分量进行独立建模,最后集成预测结果。系统实现了从数据预处理、特征分解到模型训练和预测评估的全流程自动化,并提供了可视化界面。实验表明,该方法能有效捕捉气象数据的非平稳特性,在温度、湿度等要素预测上表现良好。项目具有模块化设计、可扩
本文介绍了一个基于Java+Vue的智能合同审阅与条款建议系统,该系统结合规则链引擎和大语言模型(LLM)技术,实现了合同文本的结构化解析、风险条款自动检测和智能条款建议功能。系统采用前后端分离架构,后端使用SpringBoot微服务集成Drools规则引擎,前端基于Vue实现可视化交互界面。 项目主要特点包括: 合同文本智能分段与结构化解析 规则链驱动的风险条款自动检测 LLM模型生成优化建议
主要内容:免费开题报告、任务书、全bao定制+中期检查PPT、代码编写、🚢文编写和辅导、🚢文降重、长期答辩答疑辅导、一对一专业代码讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。
本文通过鸢尾花数据集和sklearn的MLPClassifier,直观演示了神经网络中反向传播算法的底层逻辑。从快速搭建分类器到拆解训练过程,再到可视化权重变化,帮助读者在不依赖复杂数学公式的情况下,5分钟内理解反向传播的核心机制。
本文深入探讨了GPU在神经网络训练中的核心优势,重点分析了矩阵并行计算如何大幅提升深度学习效率。通过对比CPU与GPU架构差异,揭示GPU上千个计算核心如何完美匹配神经网络中的矩阵运算需求,成为机器学习领域的'快车道'。文章还提供了PyTorch/TensorFlow框架的并行优化实践和性能调优技巧,帮助开发者最大化GPU利用率。
深度学习作为人工智能的核心技术,通过构建多层神经网络模型实现对复杂数据模式的学习与识别。其核心原理基于反向传播算法优化网络参数,在计算机视觉、自然语言处理等领域展现出巨大技术价值。Keras作为高级神经网络API,通过模块化设计和用户友好的接口,极大降低了深度学习模型构建与训练的门槛。它支持TensorFlow、PyTorch等多后端引擎,提供Sequential顺序模型和函数式API两种构建范式
深度学习技术为求解偏微分方程和优化问题提供了新的思路。神经网络通过参数化保留问题的层次结构,能够更准确地捕捉数学本质。在工程实践中,结合双层优化框架的神经网络方法,如S2-FOBA算法,显著提高了计算效率和精度。这种方法特别适用于处理非光滑性、非线性和复杂几何域问题,如流体力学和金融数学中的障碍控制问题。通过设计特殊网络结构嵌入约束条件,避免了传统正则化技术的数值困难,为最优控制问题提供了创新解决
本文详细介绍了如何使用TensorFlow 2.0和NumPy从零开始构建卷积神经网络(CNN),并分享了实战中的常见陷阱与解决方案。通过底层实现,读者可以深入理解CNN的核心原理,包括卷积层、池化层的实现,以及梯度消失、激活函数选择等关键问题。文章还提供了环境配置、数据准备和性能优化的实用技巧,帮助开发者避免常见错误,提升模型训练效率。
神经网络是机器学习中模拟人脑信息处理机制的非线性建模方法,其核心原理在于通过多层感知器实现特征自动抽象与端到端拟合。在R语言生态中,它突破了传统统计建模边界,兼具可解释性与工程落地能力。技术价值体现在无缝集成dplyr数据清洗、ggplot2可视化及Shiny部署闭环,显著降低跨语言协作成本。典型应用场景包括表格数据快速验证(如信贷评分)、图像分类(如病理切片分析)及实时预测系统嵌入。本文聚焦R原
本文用MATLAB建立一个短期电力负荷(或价格)预测系统。两个非线性回归模型(神经网络和袋式回归树)被校准,以预测给定温度预测、假日信息和历史负荷的每小时前日负荷。这些模型在数据上进行训练,并在2008年的样本外数据上进行测试。这些模型被证明能够产生高度准确的日前预测,平均误差在1-2%左右。能够通过MATLAB部署的DLL调用训练好的负荷预测模型。准确的负荷预测对于公用事业的短期运营和长期规划至
神经网络
——神经网络
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net