logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

2024年医疗大模型如何发展?私有化部署是重要方向_开源医疗大模型本地部署

导读一方面,大模型在医疗场景应用需兼顾安全性与专业性,可通过数据清洗、标注和验证等控制数据质量;另一方面,大模型的计算需要大量的算力作为支撑,轻量化、本地化部署的大模型将成为重要发展方向。‍‍2023年被很多人称为“医疗大模型的元年”,国内外均有大量厂家将大语言模型应用于医疗健康领域。据统计,截至2023年10月,我国累计公开的大模型数量已经达到238个,垂直类大模型达到103个。而2-9月,我国

文章图片
#开源#人工智能#自然语言处理 +2
打破信息差|纯文科生如何入局AI大模型行业?

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模

文章图片
#人工智能#语言模型
MCP:打破大模型信息孤岛,构建安全高效的AI智能生态!

MCP(模型上下文协议)是一种开放协议,解决了大模型的"信息孤岛"困境,使其能够安全、高效地接入外部系统。通过标准化交互规范,MCP实现了工具能力的"即插即用",大幅降低了开发成本,提升了企业数据安全边界。对开发者而言,MCP避免了重复造轮子;对企业而言,实现了安全可控的AI集成;对用户而言,提供了更强大的AI助手体验。作为AI Agent的基石,MCP将催生新一轮应用创新潮,构建互联互通的智能生

文章图片
#人工智能#深度学习#机器学习 +1
AI Agent记忆系统完全指南:解决上下文限制,打造个性化智能助手!

本文详细解析了AI Agent记忆系统的架构与实现,包括短期记忆(会话级)和长期记忆(跨会话)的核心概念、技术特性和集成方法。针对大模型上下文限制问题,介绍了缩减、卸载、隔离三大上下文工程策略,探讨了长期记忆与RAG的区别,对比了主流开源产品,并展望了记忆即服务(MaaS)和多模态融合等发展趋势,为构建高智能AI Agent提供了技术支撑。

文章图片
#人工智能#架构#transformer +1
从零开始理解Agent:为什么2025年被公认为Agent元年,以及它如何改变AI应用开发!

Agent技术经历了从早期"伪工具调用"到Function Calling成为标准,再到Claude Skills等优化的演进过程。通过"思考-行动-观察"的循环模式,Agent结合有限工具的组合,有效解决了传统工作流无法处理的长尾问题,大幅提高了系统泛化能力。虽然存在成本高、稳定性有限等挑战,但在当前技术条件下,Agent已成为AI应用开发中极具价值的架构范式,代表着从"对话的奇迹"到"行动的伙

文章图片
#人工智能#数据库#java
校招生做大模型,选预训练还是SFT?

我推荐选 pretrain,理由如下:pretrain 提高工程能力,sft 提高认知能力作为校招新人,你的当务之急只有一条:提升工程代码能力!我们拆解一下两个团队所需要的技能,你判断下哪个提升代码能力更快。

文章图片
#人工智能#自然语言处理
用大模型理解爆火的KAN网络

调参也是一门技术活。同样的例子在官网给出的结果更加准确,因为调参的时候做的更精细。下图是官网的结果,exactly由一个平方函数、一个正弦函数和一个指数函数结合。KAN还有一些其他的功能,例如能解微分方程、在学习的过程中有记忆力等等。这个先不谈,后面用到了再说吧。

文章图片
#网络#人工智能#深度学习
速通LLM——SFT、RLHF、对齐、RAG、微调大扫盲

LLM(large language model)技术发展到今天,已经有许多代码和权重都开源的模型(如llama2等)供开发者下载使用。语言模型的本质是通过算法预测下一个位置上出现概率最高的字或词,LLM的预训练阶段通常是无监督或自监督的,例如通过bert模型完成类似于完型填空的任务,数据通常来源于互联网上的大量预料。预训练后的LLM已经具备了基础的语言理解或预测能力,但可能存在输出不符合人类表达

文章图片
#人工智能#自然语言处理#RAG
【大模型实战】智能体客服Agent多轮对话设计:从不确定性到可控系统的工程实践!

文章核心内容是关于如何设计智能体客服Agent的多轮对话流程,强调将不确定的自然语言交互转化为可控、可观测、可回滚的工程系统。内容包括明确系统边界、设计清晰的多轮对话流程、使用会话状态跟踪方法、处理用户意图模糊情况,并注重可观测性、降级与回滚等工程实践。核心思想是通过结构化设计和状态管理,确保客服系统在提供服务的保持高稳定性和可靠性。

文章图片
#java#transformer#架构 +3
使用本地大模型调用代码,根本就是一场骗局!_langchain是骗局?

通过大模型调用其他工具到底可不可行?ChatGPT 或许能轻松搞定一切,但同样的需求落在本地大模型上,恐怕就要打个问号了。法国开发工程师 Emilien Lancelot 尝试了多款号称具备工具调用功能的 agent 框架,来看看本地大模型到底能不能完成任务,但结果就像他总结的“一无所获”。是什么让这位工程师失望了?用 AutoGPT,得会点“糊弄学”AutoGPT 是款貌似强大的框架,提供很酷的

文章图片
#python#开发语言#人工智能 +1
    共 559 条
  • 1
  • 2
  • 3
  • 56
  • 请选择