logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Manus 技术报告:全球首款通用AI Agent工作方式拆解

Manus 在工程层面做了很多工作,整体交互比其他产品好很多。技术层面,没什么壁垒,开源复刻版已经出来(OpenManusManus 对模型有比较深的依赖:也许有个小模型,做任务执行前的意图识别任务规划和推理,用 deepseek-r1图片识别 + 代码生成,用 Claude-3.7-sonnetManus 的 token 消耗会很高,能不能广泛用起来,取决于谁来负担这个成本。最终的任务准确性和用

文章图片
#人工智能#生成式AI#机器学习 +2
【白话机器学习系列】白话向量点积

点积(Dot Product)是机器学习中最常见的向量操作。本文将通过简洁易懂的语言配合大量图形为大家介绍点积运算及其背后的数学意义。

文章图片
#机器学习#人工智能#线性代数 +2
Lamini:大语言模型精调框架

Lamini 致力于解决 LLM 驱动开发中最困难的挑战之一。该框架提供了一个简单且一致的编程模型来抽象跨不同 LLM 的微调过程。我们很可能会在不久的将来看到 Lamini 被纳入不同的 LLM 框架。

文章图片
#语言模型#人工智能#深度学习
OpenAI最新博文:人工智能系统的行为塑造与决策权归属

2月16日,OpenAI 博客发布最新文章"How should AI systems behave, and who should decide?"。文中OpenAI首次澄清了ChatGPT的行为是如何塑造的,以及进一步的改进计划。并且宣布未来会允许更多的用户定制,并在更多领域的决策中获得更多的公众投入。本文是对这篇博客的翻译,希望大家喜欢。

文章图片
#人工智能#ChatGPT
BloombergGPT: 首个金融垂直领域大语言模型

NLP 在金融技术领域的应用广泛且复杂,主要应用场景包括情感分析、命名实体识别到问答等。大语言模型 (LLM) 已被证明可以有效处理上述任务;但是,鲜少没有报道过有专门针对金融领域的文献。本作中,我们展示了 BloombergGPT 这个拥有 500 亿参数的语言模型,它采用大量金融数据训练而来。我们基于 Bloomberg 大量的数据源构建了一个 3630 亿个token数据集,这可能是迄今为止

文章图片
#金融#语言模型#人工智能 +1
利用GPT-3 Fine-tunes训练专属语言模型

ChatGPT强大的自然语言理解力和表达力,目前只表现在通用领域。一旦进入专业领域,ChatGPT经常“一本正经,胡说八道”。此时用特定领域的知识对模型进行微调是时间成本和经济成本最高的解决方案。

文章图片
#gpt-3#人工智能#nlp +1
开源大语言模型(LLM)汇总(持续更新中)

随着ChatGPT的火爆,越来越多人希望在本地运行一个大语言模型。为此我维护了这个开源大语言模型汇总,跟踪每天不发的大语言模型和精调语言模型。

文章图片
#语言模型#人工智能#深度学习
文心一言 vs GPT-4 —— 全面横向比较

本文从语义理解、内容创作、逻辑推理、编码能力、数学能力、人格模拟6个维度对文心一言和GPT-4进行了全面系统地横向比较。

文章图片
#人工智能
万字长文:Stable Diffusion 保姆级教程

万字长文,超详细一步一步教你在本地部署运行当下超火的Stable Diffusion模型,生成各种风格图像。

文章图片
#人工智能#计算机视觉#机器学习
    共 79 条
  • 1
  • 2
  • 3
  • 8
  • 请选择