logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【Linux】报错/usr/bin/ld: demo: hidden symbol `__cpu_indicator_init‘ in /usr/lib/gcc/x86_64-linux-gnu/5/

编译c++项目的时候报错/usr/bin/ld: demo: hidden symbol `__cpu_indicator_init’ in /usr/lib/gcc/x86_64-linux-gnu/5/libgcc.a(cpuinfo.o) is referenced by DSO/usr/bin/ld: final link failed: Bad valuecollect2: error:

#linux#c++
【mllm】——x64模拟htp的后端无法编译debug

qualcomm是支持x64模拟htp推理的,这样比较好debug,方便调试。但是mllm中是不支持的。因为他htp后端强制使用了。来申请内存,就是高通说的shared mem。但是这部分的问题是可以修复的,需要自己或作者出点工作量。后续的人有同样问题的可参考。通过自定义qualcomm graph使用高通的htp后端进行llm推理,网络暂时只有。

【cmake】——指定find_package的搜索路径

问题在用cmake编译项目的时候,很多时候需要用find_package来导入一些库,比如opencv,cuda等。但是有时候,下载了预编译好的项目时,怎么手动指定路径呢?解决方案通过设定一个project_DIR变量来指定路径,该路径是projectConfig.cmake文件所在的路径,比如下载预编译好的llvm。set(LLVM_DIR yourpath/llvm-7.0/lib/cmake

【pybind11】——python C/C++扩展编译

转载自:https://www.jianshu.com/p/819e3e8fbe5e作者:侠之大者_7d3f1. 前言在之前的pybind11系列实践中,开发流程大致是这样的:第一步: 首先在C/C++ IDE中编写C/C++函数,然后采用pybind11封装为python可调用的包装函数, 之后采用C/C++编译器生成.pyd文件第二步:将生成的.pyd文件复制到python工程中,之后作为py

#python#c++
【python源码】——采用eigen为python写矩阵运算拓展(三)

整理修改自:https://zhuanlan.zhihu.com/p/106773873关键词:c++,python,eigen1. 环境python3.6g++7.5eigen32. 拓展stub.cc#define PY_SSIZE_T_CLEAN#include <Python.h>extern PyObject* initModule();PyMODINIT_FUNCPyIni

#python#c++
【目标检测】centernet嵌入式网络优化

原文:https://mp.weixin.qq.com/s/PrkID3lnoDFVUxh-i3V2UQ这是来自腾讯的一篇解读,针对嵌入式设备,从目标检测模型方面进行优化。二、选型近几年物体检测算法日新月异,面对琳琅满目的检测模型(见图 1),合适的才是最好的。(1)One-stage从模型的层次结构上,可分为两阶段(two-stage)和单阶段(one-stage)。(a)Two-...

ONNX export failed on ATen operator grid_sampler because torch.onnx.symbolic.grid_sampler does not e

pytorch转onnx时,pytorch中用了F.grid_sample,报错:‘ONNX export failed on ATen operator grid_sampler because torch.onnx.symbolic.grid_sampler does not exist’解决方案暂时无

#pytorch
【onnx】——onnx模型计算图解析

整个定义是主要就是这三个部分最外层是ModelProto,记录一些模型信息:ir版本,来自pytorch/tensorflow,… , 和GraphProto////};GraphProto才是核心,里面主要包含:1.保存const tensor + 预训练的参数。2.保存每个op 输入,输出 tensor 名字。}NodeProto}所以整个计算图的node的输入,来自于node.input,n

#人工智能#深度学习#tensorflow
【Faiss】源码阅读(三)——IVFFlat(倒序索引)

摘要: 这里主要讲整个实现过程与核心思路。1. 核心思路前面讲的IndexFlatL2的索引方式,主要就是一种暴力搜索的方式,只是在计算的过程中针对不同的平台进行了指令集优化。这里的IndexIVFFlat索引主要对原始m个样本随机下采样 n×256 个样本,n:表示聚类中心点个数对下采样的样本,采用kmean进行聚类对原始m个底库样本,根据聚类中心进行分桶对要查询的query,针对聚类中心进行分

#faiss
    共 162 条
  • 1
  • 2
  • 3
  • 17
  • 请选择