
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
开发大模型相关应用,其技术核心点虽然在大语言模型上,但一般通过调用 API 或开源模型来实现核心的理解与生成,通过 Prompt Enginnering 来实现大语言模型的控制,因此,虽然大模型是深度学习领域的集大成之作,大模型开发却更多是一个工程问题。在大模型开发中,我们一般不会去大幅度改动模型,而是将大模型作为一个调用工具,通过 Prompt Engineering、数据工程、业务逻辑分解等手

吴恩达教授开源了一个专注于翻译的 AI Agent——translation-agent。这个 translate-agent 主要以 AI 大模型为翻译引擎,再通过在工作流中增加一些针对性的建议和反思,辅以:提示词设定输出风格处理习语和特殊术语指定语言使用或方言等使之更易于翻译出比较符合当地语言的内容。今天在 Dify 中通过可视化工作流的方式来重现一下这个 AI Agent~Dify 是一款开

本地部署大模型,再构建个人知识库,跑自己的文档、数据等,有很多好处。比如,隐私的财务数据可以借力AI大模型做总结,股票数据实时接入到大模型做数据分析,个人word文档批量读取做总结等。本篇教程继续系列上一篇教程:自己电脑搭建个人知识库,一般电脑也能玩(支持通义千问、GPT等)。在此基础上,扩展支持PDF和txt文件的读取。错过上篇教程的,我简单再在这里和大家回顾一下。

Llama 3.1 405B 是首个公开可用的模型,在常识、可操纵性、数学、工具使用和多语言翻译等方面可与顶级 AI 模型相媲美。Meta 表示最新一代的 Llama 将激发新的应用程序和建模范式,包括利用合成数据生成来提升和训练更小的模型,以及模型蒸馏 —— 这是一种在开源领域从未达到的能力。与此同时,Meta 还推出了 8B 和 70B 模型的升级版本,支持多种语言,上下文长度达到 128K,

检索增强生成)是一种强大的工具,整合了从庞大知识库中检索到的相关信息,并以此为基础,指导大型语言模型生成更为精准的答案,从而显著提升了回答的准确性与深度。2020 年,Meta AI 研究人员提出了RAG的方法,用于提高 LLM 在特定任务上的性能。信息滞后:LLM 的知识是静态的,来源于当时训练时的数据,也就是 LLM 无法直接提供最新的信息。模型幻觉:实践表明,当前的生成式 AI 技术存在一定

微软刚刚最新开源了他的多模态模型:Florence-VL,核心是"看图"能力特别强,看得仔细,能看到更多细节,可以从不同角度理解图片内容并准确回复。3B、8B两个版本,对于需要AI理解图片的场景,智能助手、图片搜索、自动图片描述等等比较实用Florence-VL比现有视觉编码器的视觉-语言对齐能力更强在视觉问答(VQA)、视觉感知、幻觉检测、文字识别(OCR)图表理解、知识密集型理解任务等多个基准

美团平台招聘面向负责和业务场景的算法研究员和算法工程师。作为具有全国影响力的零售科技平台,美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家。在通用人工智能行业不断进步的前景下,我们团队的愿景是让绝大多数人都能够享受到属于他们自己的。为了实现这一愿景,我们面临着许多技术上的挑战,欢迎你的加入。这里有着。
Hyper-SD 由字节跳动开源,使用了神经网络的模型蒸馏技术从 SDXL Base 1.0 和 Stable-Diffusion v1-5 模型中提取出了高质量的图像特征信息。具体来说,字节团队提出了一种新颖的框架,协同整合了ODE轨迹保持和ODE轨迹重构的优势,既保证了新模型的性能,又提升提升了新模型的效率。首先,它引入了轨迹分段一致性蒸馏,在预先定义的时间步长段内逐步进行一致性蒸馏,从而从更

1.有大模型方向论文的硕博很少,大部分论文还是在模型架构排列组合,屎上雕花。2.有大模型训练经验简历的很少,有65B以上大模型全量训练的更少,有预训练的经验就像捡到了宝。3.模型评测和强化学习方面经验很稀缺。4.大模型选型上一定要紧跟行业主流认知。5.成功落地的场景稀少,目前都在探索阶段。6.大模型需求依然很旺盛,优秀简历很抢手7.大模型八股文的频率高吗?
好了:当然,AI大模型的“基本功”也是具备的,你可以边看视频边提问(哪里不会问哪里):如此一来,在B站学习知识这件事,效率可以说是一下子Pro Max了。除此之外,之前类似Mac里非常单一的搜索功能(Command+空格),在安了豆包电脑版之后也直接**“变废为宝”**。只需按下快捷键**“Option+空格”**,类似的搜索界面,却是截然不同的打开方式。除了基本的搜索、提问功能之外,可以直接把它
