logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

低成本+高性能+超灵活!Deepseek 671B+Milvus重新定义知识库搭建

老板说,这个项目得上Deepseek,还得再做个知识库…”还有哪个开发者,最近没听到这样的抱怨?Deepseek爆火,推理端的智能提速,算力成本急剧下降,让不少原本不想用大模型,用不起大模型的企业,一夕之间全部拥抱AI,开启了降本增效。在这个过程中,可是当你真正开始调研的时候,就会发现这事儿没那么简单:想用开源的,连基本的问答准确度都难以保证。比如,前不久,我们推出了基于Deepseek 7b+M

文章图片
#milvus#c##开发语言 +2
沈向洋院士:AI Agent时代,大模型产业落地的八个思考

9月5日,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋在2024 Inclusion·外滩大会上分享了他对大模型产业落地的八个思考。他认为,AI Agent时代的到来,不会是一个神奇而强大的模型突然代替了所有工作流,它涉及技术、工程与市场的不断磨合,最终以超预期的服务呈现给人类。“今天做大模型,做深度学习,首先最重要的事情是要有算力。”沈向洋表示。他指出,从2010年开始,大模型需要的算力

文章图片
#人工智能#大数据#网络 +1
华为&清华 | 在华为昇腾上优化生产级LLM服务,MFU性能直逼英伟达A800

要满足生产级大型语言模型(LLM)服务系统对低延迟和低成本高效率日益增长的需求,需要集成先进的优化技术。然而,LLM 的输入输出长度动态且不可预测,再加上这些优化技术,加剧了工作负载的可变性,使得人工智能加速器,尤其是采用tile-based(基于分块)编程模型的 DSA,难以保持高效率。为了应对这一挑战,本文推出了 XY-Serve,这是一个多功能、昇腾(Ascend) 原生、端到端生产型 LL

文章图片
#华为#人工智能#neo4j +3
机器学习过程:特征、模型、优化和评估

机器学习从20世纪80年代开始引领人工智能的发展潮流,其对人工智能的重要贡献在于从人工赋予机器智能转移到机器自行习得智能。毫无疑问,是智能的集中体现,机器如何模拟人的这一能力?实践证明了以大脑级别得大规模并行架构为基础得算法比逻辑规则为基础的算法更实用。“人”如何做好“人”擅长的事情,把剩下的交给机器。从强算法到强算力,再到强数据,机器不断在延伸和拓展人的能力边界。在机器学习中,特征(Featur

文章图片
#机器学习#人工智能#transformer +2
deepseek本地部署最简教程——搭建个人AI知识库

尽管本地化部署的DeepSeek模型在算力规模和功能完备性上无法媲美云端全量版本,但只要喂给它「独家秘方」——也就是你电脑里的文档、代码、笔记这些干货,它立马就能变身成你的专属知识小助手!当然,AnythingLLM还具备其他功能,如代码托管和官方API的接入等,受篇幅所限,本文不再展开论述,各位可自行探索。需要注意的是,本地部署的AI回答精准度仍然受到硬件性能的制约。建议开发者参考以下硬件选型策

文章图片
#人工智能#neo4j#milvus +2
从思维到机器:全面解析爆火的Manus AI智能体技术原理及应用、机遇与挑战

这篇文章详细介绍了Manus AI,一种在2025年初推出的通用人工智能代理,旨在弥合“思维”和“行动”之间的差距。Manus AI不仅具备像大型语言模型那样的思考和规划能力,还能自主执行复杂任务并交付实际结果。本文从技术架构、应用领域、与其他AI技术的比较、优缺点以及未来前景等方面对Manus AI进行了全面概述。

文章图片
#人工智能#百度#机器学习 +3
知识蒸馏:由诺奖得主Hinton提出,9年后被DeepSeek带火,究竟是什么?

知识蒸馏最早在2015年被诺贝尔物理学奖得主Geoffrey Hinton提出,在2025又被DeepSeek带火看了许多介绍蒸馏技术的文章,我们希望把知识蒸馏这项技术的前世今生介绍给大家2006年的春天,英特尔刚刚发布第一个双核处理器 E6320(4 M 缓存、1.86 GHz),苹果也刚发布了第一台MacBook,而第一代iPhone还在乔布斯的实验室中孕育当时研究机器学习学者们发现:用机器做

文章图片
#知识图谱#人工智能#neo4j +2
RAG15种分块策略进行汇总介绍

固定大小的分块将文档拆分为预定义大小的块,通常按字数、标记数或字符数。当您需要一种简单明了的方法并且文档结构并不重要时。它在处理较小、不太复杂的文档时效果很好。

文章图片
#自然语言处理#人工智能#javascript +2
用 DeepSeek 快速打造自己的 AI 系统(附完整代码)

今天,我将带你了解如何通过构建一个本地化的检索增强生成(RAG)系统,直接从文档中获取精准答案。通过结合和,你可以轻松实现这一目标,而无需依赖云服务,也能避免云 API 延迟的困扰。

文章图片
#人工智能#asp.net#后端 +2
一篇80页多模态RAG技术最新综述:MRAG3.0

多模态检索增强型生成(Multimodal Retrieval-Augmented Generation, MRAG)通过整合多模态数据(如文本、图像和视频)来增强大型语言模型(LLMs)的能力,显著提高了生成的质量并减少幻觉,系统地回顾了MRAG进展、技术组件等。,每个阶段都引入了新的技术和架构。MRAG1.0 的架构,通常被称为“伪MRAG”,与传统RAG非常相似,由三个模块组成:文档解析与索

文章图片
#数据库#汽车#重构 +3
    共 1014 条
  • 1
  • 2
  • 3
  • 102
  • 请选择