logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

知识图谱+知识库RAG项目Yuxi-Know及大模型推理内部可视化工具OpenMAV实现拆解

关于可解释,其实是大模型的一个很有趣的话题,我们已经讲过多次了,例如,《注意,“电路”(Circuit)并不是传统意义上的电子电路,而是指一种计算图(computational graph),用于描述语言模型内部的计算过程和特征之间的相互作用。这种“电路”概念是类比于神经科学中的“神经回路”(neural circuits),用于揭示模型内部的信息处理机制。然后呢,这块其实有出来一些新的可视化工具

文章图片
#知识图谱#人工智能#自然语言处理 +1
Transformer架构优化:继续“暴力堆砌算力”还是“精细化算法设计”?

Transformer架构凭借其强大的并行处理能力和自注意力机制,在自然语言处理(NLP)领域取得了显著成就。然而,随着模型规模的扩大和应用场景的多样化,Transformer架构也遭遇了计算效率低下和显存占用过大等挑战。面对这些挑战,我们是应该继续遵循缩放定律(Scaling Law),通过“暴力堆砌算力”来应对,还是应该选择“精细化算法设计”来优化Transformer架构呢?DeepSeek

文章图片
#人工智能#自然语言处理#开源 +3
2025年开源RAG最佳选择:浙大与蚂蚁的 KAG 技术突破

浙江大学与蚂蚁集团推出的知识增强生成(KAG)框架,旨在解决传统检索增强生成(RAG)方法在多跳推理和复杂逻辑处理中的不足。KAG通过结合知识图谱(KGs)和创新技术,显著提升了大语言模型在专业领域问答中的准确性和效率。LLM友好的知识表示:通过层次化的知识组织,使大语言模型更适应专业领域的知识处理。知识图谱与文本块互索引:提高了数据检索的精确度和效率,增强了知识的整合能力。逻辑形式引导推理:结合

文章图片
#人工智能#大数据#知识图谱 +1
基于深度强化学习的股票交易策略模型,效果显著超越Global X Guru、Mirae Asset等全球金融服务公司

本文研究金融深度强化学习模型中时间窗口的优化,采用2D卷积神经网络(CNN)。提出将时间字段视为超参数,分析其对模型性能的影响。通过逐步扩展观察窗口(从两周到十二周)来评估不同时间窗口的效果。实验分为两种设置:一是按公司分组特征,二是按类别排列特征。发现短时间窗口在未分组情况下效果最佳,而引入分组后,长时间窗口表现更佳。在两个不同特征数据集上重复实验,结果一致。最终模型显著超越全球金融服务公司,如

文章图片
#人工智能#自然语言处理#开源 +1
马斯克大力出奇迹,Grok3 把 o3 干翻了

就在刚刚,马斯克发布了 xAI 最新的模型:Grok-3 和 Grok-3 推理版!现在 X 官网上开会员已经可以直接体验,网页和应用的所有功能会在一周内完善、API 会在几周内推出。什么模型才让马斯克敢说是“地球上最聪明的 AI?简单粗暴给大家汇总一下目前的信息:Grok 3 表现超越 DeepSeek R1、GPT-o1、Gemini 2 Pro、GPT-4o、Claude 3.5大模型盲测榜

文章图片
#java#前端#javascript +3
什么是大模型?一图全面了解大模型,附国内外知名大模型及240余家大模型清单!

AI大模型是“大数据+大算力+强算法”结合的产物,是一种能够利用大数据和神经网络来模拟人类思维和创造力的人工智能算法。它利用海量的数据和深度学习技术来理解、生成和预测新内容,通常情况下有数百亿乃至数万亿个参数,可以在不同的领域和任务中表现出智能。

文章图片
#语言模型#人工智能#自然语言处理 +1
零基础也能看懂的ChatGPT等大模型入门解析!大模型入门到精通,看这篇就够了!

GPT 对应的是三个关键概念:生成式(Generative)、预训练(Pre-Training)和Transformer。生成式(Generative):是指通过学习历史数据来生成全新的数据。当使用ChatGPT回答问题时,是逐字(或三四个字符一起)生成的。在生成过程中,每一个字(或词,在英文中可能是词根)都可以被称作一个 token。预训练(Pre-Training):是指预先训练模型。

文章图片
#百度#人工智能#大数据 +1
马斯克大力出奇迹,Grok3 把 o3 干翻了

就在刚刚,马斯克发布了 xAI 最新的模型:Grok-3 和 Grok-3 推理版!现在 X 官网上开会员已经可以直接体验,网页和应用的所有功能会在一周内完善、API 会在几周内推出。什么模型才让马斯克敢说是“地球上最聪明的 AI?简单粗暴给大家汇总一下目前的信息:Grok 3 表现超越 DeepSeek R1、GPT-o1、Gemini 2 Pro、GPT-4o、Claude 3.5大模型盲测榜

文章图片
#java#前端#javascript +3
大模型2025年3月报告分析2:智能体AI Agent

AI 智能体 Agent 的评测报告来了。【*智能体Agent深度分析介绍*】主要介绍各个模型在SuperCLUE通用榜单智能体Agent任务上的表现,包括对国内外模型的表现对比、九大任务场景的模型表现、推理模型与基础模型的的表现对比、当前模型在Agent能力上的不足。【智能体Agent任务介绍】主要考察在中文场景下基于可执行的环境,LLM作为代理,在单轮或多轮对话中调用工具完成任务的能力。【智能

文章图片
#人工智能#语言模型#自动化 +1
AI大模型入门终极教程(非常详细),AI大模型入门到精通,收藏这一篇就够了!

在人工智能(AI)技术日新月异的今天,大模型作为该领域的璀璨明珠,正引领着技术革新的浪潮,成为推动社会进步与产业升级的关键力量。这些大模型凭借其卓越的数据处理效能与深邃的模式识别能力,在自然语言处理、计算机视觉、智能推荐等多个维度上展现出非凡的潜力,为各行各业铺设了通往智能化转型的康庄大道。随着大模型技术的普及与应用深化,企业对相关人才的需求急剧增长,尤其是AIGC(人工智能生成内容)领域的高端人

文章图片
#人工智能#自然语言处理#语言模型 +1
    共 82 条
  • 1
  • 2
  • 3
  • 9
  • 请选择