
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
点积(Dot Product)是机器学习中最常见的向量操作。本文将通过简洁易懂的语言配合大量图形为大家介绍点积运算及其背后的数学意义。

Lamini 致力于解决 LLM 驱动开发中最困难的挑战之一。该框架提供了一个简单且一致的编程模型来抽象跨不同 LLM 的微调过程。我们很可能会在不久的将来看到 Lamini 被纳入不同的 LLM 框架。

2月16日,OpenAI 博客发布最新文章"How should AI systems behave, and who should decide?"。文中OpenAI首次澄清了ChatGPT的行为是如何塑造的,以及进一步的改进计划。并且宣布未来会允许更多的用户定制,并在更多领域的决策中获得更多的公众投入。本文是对这篇博客的翻译,希望大家喜欢。

NLP 在金融技术领域的应用广泛且复杂,主要应用场景包括情感分析、命名实体识别到问答等。大语言模型 (LLM) 已被证明可以有效处理上述任务;但是,鲜少没有报道过有专门针对金融领域的文献。本作中,我们展示了 BloombergGPT 这个拥有 500 亿参数的语言模型,它采用大量金融数据训练而来。我们基于 Bloomberg 大量的数据源构建了一个 3630 亿个token数据集,这可能是迄今为止

快快围观加州理工数学系教授、菲尔茨奖得主陶哲轩如何用 GPT-4 辅助数学研究。

梯度下降是机器学习中最常见的优化算法之一。理解它的基本实现是理解所有基于它构建的高级优化算法的基础。本文详细为大家推导了 MSE 作为损失函数时的梯度下降公式。

本文深入浅出地讲解了 Softmax 函数的原理和作用。

2月16日,OpenAI 博客发布最新文章"How should AI systems behave, and who should decide?"。文中OpenAI首次澄清了ChatGPT的行为是如何塑造的,以及进一步的改进计划。并且宣布未来会允许更多的用户定制,并在更多领域的决策中获得更多的公众投入。本文是对这篇博客的翻译,希望大家喜欢。

参考Yoon Kim的论文"Convolutional Neural Networks for Sentence Classification",实现TextCNN卷积神经网络进行文本分类。

Dropout 是神经网络的一种正则化技术,它在训练时以指定的概率 p(常见值为 p=0.5)丢弃一个单元(连同连接)。在测试时,所有单元都存在,但权重按 p 缩放(即变为 pw)。








