logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

昇腾atlas 300I duo部署Qwen3-8B完整实战:从选型到成功运行

如果出现没有的新的模型怎么部署,这个时候可以通过修改模型的config.json中model_type等操作,,但是一般都是不行的,本来就很难用还搞创新;为了排除是模型太大影响,我也尝试了切换到qwen3-0.5b,为了排除是显卡只支持FP16或只支持BFP16,我两种都尝试了。qwen3搜索后发现只有mindie2版本的支持,如果下成mindie1.X肯定是部署不上的;一直跟着执行,在安装驱动时

文章图片
#人工智能#昇腾
昇腾atlas 300I duo部署Qwen3-8B完整实战:从选型到成功运行

如果出现没有的新的模型怎么部署,这个时候可以通过修改模型的config.json中model_type等操作,,但是一般都是不行的,本来就很难用还搞创新;为了排除是模型太大影响,我也尝试了切换到qwen3-0.5b,为了排除是显卡只支持FP16或只支持BFP16,我两种都尝试了。qwen3搜索后发现只有mindie2版本的支持,如果下成mindie1.X肯定是部署不上的;一直跟着执行,在安装驱动时

文章图片
#人工智能#昇腾
MCP模型上下文协议:基于FastMCP 2.0的实践(2)

现在我们定义一个server.py代码,使用了fastmcp对我们的函数进行包装,即一个MCP服务。Win64;}):"""抓取指定 URL 的 HTML 文本内容参数:url (str): 要抓取的网页 URL返回:dict: 包含状态码、HTML 文本和提取的纯文本"""try:# 发送 HTTP 请求# 检查状态码# 获取 HTML 内容# 使用 BeautifulSoup 解析 HTML#

文章图片
#语言模型#人工智能
大模型压缩:从研究到生产的完整攻略(1)

量化的核心思想是将高精度的数值表示映射到低精度空间,这个过程本质上是一种有损压缩。FP32早期AI模型主要使用32位浮点数进行训练和推理,保证计算精度但存储和计算开销巨大。32 bits ÷ 8 = 4 bytes,需要4个字节存储。FP162017年英伟达开始支持FP16精度,标志着现代量化技术的开端,在保持相对精度的同时显著减少存储需求。16 bits ÷ 8 = 2 bytes,需要2个字节

文章图片
#语言模型#人工智能
大语言模型的推理能力

简单说,就是模型在回答问题时会先输出一大段推理过程,然后才给出最终答案。下图我们分别在deepseek的官网使用不带深度思考的与带深度思考(DeepSeek-R1)的模型对北京是中国的首都吗?可以看到当我们使用深度思考模型AI不会直接回答,而是会先来一段内心独白再去回答,这中间的内心独白就叫做推理。推理能力类似早先年间计算机视觉领域的可视化模型输出的过程。推理能力是某些大模型本身就存在的能力,我们

文章图片
#语言模型#人工智能#自然语言处理
RAG文本分块

不论是向量化模型还是大语言模型,都存在输入长度的限制。对于超过限制的文本,模型会进行截断,造成语义缺失。分块可以确保每个文本片段都在模型的处理范围内,避免重要信息的丢失。

文章图片
#人工智能#语言模型
大模型实践:图文解锁Ollama在个人笔记本上部署llm

Ollama是一个开源的大语言模型管理平台,它允许用户在本地机器上部署、管理和使用各种开源语言模型。Ollama最出色的优点如下:将开源模型(如DeepSeek、Llama等)下载并部署到本地。从而让公司实现私有化+免费部署LLM。性能强大:充分利用本地资源,既可以使用GPU也可以使用CPU。如果没有Ollama,我们需要自己配置GPU环境如cuda等等,与传统的模型部署相比,Ollama大大简化

文章图片
#语言模型#人工智能#算法
大模型工具与案例:云服务器部署dify与使用

如果您可以装wsl,可以在本机部署因为笔者的windows电脑不可以安装wsl,所以本文会带大家在linux云服务器上部署。目前很多厂家都推出了一键部署,但是价格也有差阿里云 通用型服务器 70rmb/月华为云比较便宜,我这边选的服务器是西南贵州,成功部署大约。

文章图片
#语言模型#人工智能
大模型Embedding模型选择

该指标体现Embedding模型在分类(Classification)、聚类(Clustering)、对分类(Pair Classification)、重排序(Reranking)、检索(Retrieval)等任务的表现。嵌入模型不仅能够编码词汇本身的含义,还能捕捉词与词之间、句子与句子之间的关联关系。这种语义相似性搜索是基于向量空间中的距离计算,而非简单的关键词匹配,能够更好地理解自然语言的语义

文章图片
#语言模型#人工智能
评估每种大模型需要多少GPU显存方法与技巧

如何评估每种大模型需要多少GPU显存?本文给出方法与技巧

文章图片
#人工智能#语言模型
    共 19 条
  • 1
  • 2
  • 请选择