logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen3技术之模型预训练

本文总结了Qwen3的预训练过程中的,数据获取,数据配比,三大预训练步骤(通用、推理、长上下文),超参数调节,测评等预训练过程中的关键步骤。

#人工智能#机器学习#深度学习
大模型四种常见安全问题与攻击案例

本文对promptfoo给出的四种安全问题做了详细解读,并给出对应案例。

文章图片
#安全
解读“大语言模型(LLM)安全性测评基准”

本文汇总了,大语言模型在用户输入prompt的操作后,大语言模型输出相应结果,这个过程中遇到的两大类安全问题,8种“prompt安全”问题与6种“内容安全”问题。

文章图片
#语言模型#人工智能#自然语言处理
Jinja2模板引擎SSTI漏洞

Jinja2 模板引擎在处理模板时执行了攻击者注入的恶意代码,从而引发了严重的安全问题,如敏感信息泄露、服务器被恶意控制

文章图片
#安全#web安全#网络 +1
用promptfoo做大模型安全性测评

本文讲解了运行promptfoo做大模型安全性测评的过程以及结果分析

文章图片
#安全#人工智能
从TinyZero的数据与源码来理解DeepSeek-R1-Zero的强化学习训练过程

通过具体的数据与处理训练过程,来更好的理解DeepSeek-R1-Zero的强化学习训练方法。

文章图片
#算法#语言模型
解读“大语言模型(LLM)安全性测评基准”

本文汇总了,大语言模型在用户输入prompt的操作后,大语言模型输出相应结果,这个过程中遇到的两大类安全问题,8种“prompt安全”问题与6种“内容安全”问题。

文章图片
#语言模型#人工智能#自然语言处理
从TinyZero的数据与源码来理解DeepSeek-R1-Zero的强化学习训练过程

通过具体的数据与处理训练过程,来更好的理解DeepSeek-R1-Zero的强化学习训练方法。

文章图片
#算法#语言模型
深度学习中为什么使用卷积?

深层神经网络中使用卷积的优点:参数共享,稀疏连接,平移不变。参数共享(Parameter Sharing)准确的定义如下:A feature detector (such as a vertical edge detector) that's useful in one part of the image is probably useful in another part o...

#机器学习#神经网络
解读“大语言模型(LLM)安全性测评基准”

本文汇总了,大语言模型在用户输入prompt的操作后,大语言模型输出相应结果,这个过程中遇到的两大类安全问题,8种“prompt安全”问题与6种“内容安全”问题。

文章图片
#语言模型#人工智能#自然语言处理
    共 71 条
  • 1
  • 2
  • 3
  • 8
  • 请选择