程序猿李巡天个人主页

@m0_59235945

程序猿李巡天

2022-11-24 22:14:42 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

北大Chatlaw - 基于知识图谱增强混合专家模型的多智能体法律助手

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。研究问题：这篇文章要解决的问题是如何利用多智能体协作和知识图谱增强的混合专家（MoE）大型语言模型（LLM）来提高法律服务的可靠性和准确性，以解决现有法律辅助服务中存在的信息幻觉问题。研究难

#知识图谱 #人工智能 #自动驾驶 +3

哈啰：构建智能出行RAG，ES还是向量数据库？

在2024年的Inclusion·外滩大会上，哈啰集团宣布已经构建了全面的AI布局，以迎接大模型时代的到来。如同一匹黑马，哈啰在智能时代脱颖而出，其服务版图从最初的单车扩张到如今的本地出行及生活服务平台。在技术探索的征途上，哈啰通过构建基于向量数据库的RAG（Retrieval-Augmented Generation）应用，不断强化业务效能。大模型应用，如海螺机器人、交易机器人、光子引擎、贾维斯

#elasticsearch #数据库 #大数据 +4

高级RAG技术研究之： Prompt 压缩

LLMLingua认为Selective Context经常忽视压缩内容之间的互连以及 LLM 和用于Prompt压缩的小语言模型之间的相关性。LLMLingua 正是解决了这些问题。具体来说，如图 4 所示，LLMLingua 采用预算控制器为原始提示的各个组成部分（例如指令、演示和问题）动态分配不同的压缩比。它还执行粗粒度、演示级压缩，即使在高压缩比下也能保持语义完整性。此外，LLMLingu

#人工智能 #大数据 #oracle +1

国内超大型智能算力中心建设白皮书 2024

智算中心建设通过领先的体系架构设计，以算力基建化为主体、以算法基建化为引领、以服务智件化为依托，以设施绿色化为支撑，从基建、硬件、软件、算法、服务等全环节开展关键技术落地与应用。一、体系架构（一）总体架构图8 智算中心总体架构智能算力中心建设白皮书，重点围绕基础、支撑、功能和目标四大部分，创新性地提出了智算中心总体架构。其中，基础部分是支撑智算中心建设与应用的先进人工智能理论和计算架构；支撑部分围

#人工智能 #大数据 #oracle +1

基于GARCH-Informed神经网络进行金融市场波动性预测，在七个全球代表性股票市场指数上均表现优异

波动性是风险的重要指标，广泛用于金融投资定价。GARCH模型及其变体是股票波动性预测的经典模型。深度学习模型在波动性预测中逐渐受到关注，显示出良好的准确性。本文提出了GARCH-Informed Neural Network (GINN)模型，结合GARCH与LSTM的优点，提升市场波动性预测准确性。GINN在外部样本预测性能上优于其他时间序列模型，表现出更高的R²、均方误差(MSE)和平均绝对误

#神经网络 #人工智能 #深度学习 +3

Nature ｜Raman成像与深度学习模型相结合快速诊断脑肿瘤

1、FastGlioma能够在手术过程中快速、无创地对肿瘤边界进行高分辨率检测2、模型在不同人群和医疗环境中能适应各种分型、分子遗传特征的胶质瘤亚型3、模拟临床干预试验证明了FastGlioma作为手术辅助手段的可行性和安全性近日，密歇根大学Todd Hollon课题组在Nature上发表题为: Foundation models for fast, label-free detection of

#深度学习 #人工智能 #机器学习 +2

大语言模型LLMs如何进行探索性数据分析

如果你正在创建自定义GPT,你可以为GPT提供一组自定义指令来指导其行为。对于不支持自定义实例的其他模型,如Claude或Gemini,你可以在对话开始时提供一个长形式的提示,其中包含这种指导。根据我的经验,为AI分析师包含以下指导是有用的:身份:告知大语言模型其身份。数据集:如果你计划持续使用相同的数据集,值得为大语言模型提供一些关于数据集性质的额外内容。数据可视化最佳实践:大语言模型渲染的图表

#语言模型 #数据分析 #人工智能 +3

一文通关数据仓库

自上而下建立数据仓库（DW-DM）又称为范式建模，之所以称为范式建模，是因为这种方式构建的数据仓库，信息存储是符合第三范式。为什么需要存储信息满足第三范式？因为所有的表都是先抽取到数仓里面，在进行维度建模。如果数据不满足第三范式的话，数据维度建模数据处理差，处理成本太大。

#数据仓库 #spark #大数据 +3

一文彻底搞懂Transformer - Training（模型训练）

*WMT 2014英德和英法数据集在用于训练Transformer模型之前，需要进行一系列的数据预处理步骤。**下载数据集：首先，从WMT官方网站或相关资源中下载WMT 2014英德和英法数据集。这些数据集通常包括训练集、验证集和测试集。解压数据集：将下载的数据集文件（如.tgz或.tar格式）解压到指定的目录中，以便进行后续处理。去除无关信息：从文本中去除HTML标签、特殊字符、URL链接等与翻

#transformer #深度学习 #人工智能 +3

【 86.9k 下载! 】Mistral AI开源Pixtral-12B多模态大模型，效果力压llama3.2/Qwen2-VL

Pixtral 12B 是由Mistral AI 推出的一款具有 12 亿参数的多模态语言模型，具备处理自然图像和文档的能力，在多模态基准测试中取得了领先性能。与许多其他开源模型不同，Pixtral 12B 在保持多模态任务优势的同时，也没有牺牲自然语言处理性能。多模态能力：Pixtral 12B 在多项多模态任务中表现出色，例如在 MMMU 推理基准测试中达到了 52.5% 的准确率。灵活的图像

#人工智能 #学习 #算法 +1

共 37 条

请选择