SNPE - 程序员宅基地

机器学习面经四、深度学习

四、深度学习 1、BatchNormalization的作用神经网络在训练的时候随着网络层数的加深,激活函数的输入值的整体分布逐渐往激活函数的取值区间上下限靠近,从而导致在反向传播时低层的神经网络的梯度消失。...

神经网络量化入门--量化感知训练

神经网络量化入门系列第三篇：后量化训练

java ndk编译opencv、opencv_contrib编译和使用相机Aruco姿态估计

OpenCV3.1时代开始，Android平台就已经有官方提供的OpenCV库了，理论上我们是不需要再自行编译的。而且OpenCV的官方建议也是直接使用OpenCV4Android库（也就是预编译的libopencv_java3.so），并提供了两套使用方法：...

骁龙神经处理引擎SDK 参考指南(1)

标签： caffe 深度学习人工智能

本文档提供了 Snapdragon TM神经处理引擎 (SNPE) 软件开发套件 (SDK) 用户指南和 API 参考指南。Snapdragon 神经处理引擎 (SNPE) 是用于执行深度神经网络的 Qualcomm Snapdragon 软件加速运行时。执行任意深度的神经...

TensorFlow Lite源码解析之一

标签： TensorFlow Lite 推理引擎人工智能

每一个成功的人工智能背后，都有一个摸摸推理的引擎。想知道TFLite是怎么工作的么，戳我了解更多！

cpp-MNN是一个轻量级的深度神经网络推理引擎

标签： C/C 开发-机器学习

MNN是一个轻量级的深度神经网络推理引擎，在端侧加载深度神经网络模型进行推理预测。目前，MNN已经在阿里巴巴的手机淘宝、手机天猫、优酷等20多个App中使用，覆盖直播、短视频、搜索推荐、商品图像搜索、互动营销、...

骁龙神经处理引擎SDK参考指南（8）

标签： caffe 深度学习人工智能

请注意，注册库的绝对路径是使用上述 API 明确提供给 SNPE 的，而实现库可以存在于系统上任何应该被库加载器发现的地方（在 Unix 系统上使用 LD_LIBRARY_PATH）。UDO 可以在流程中注册，并由在流程的整个生命周期中...

在高通平台的cpu/gpu/dsp/npu上运行神经网络模型

为了能在高通的gpu/dsp上运行神经网络，高通提供了一套sdk:https://developer.qualcomm.com/docs/snpe/overview.html 通过这套sdk,可以把caffe/tensorflow等平台的模型转成.dlc格式的离线模型，可选地，还可以对...

使用 MediaPipe 轻松实现设备端机器学习

标签：机器学习 mediapipe llm

了解新一代 MediaPipe 解决方案，开发者可利用该产品套件轻松地将设备端机器学习解决方案集成到不同平台（Android、Web、桌面等）的应用中。您还可以使用自己的训练数据集轻松自定义部分解决方案，只需几行代码即可...

使用python3.6编译caffe

使用snpe转换模型，调用的是python3 系统是ubuntu18.04 二、安装python3.6 使用anaconda安装python3.6和requirements.txt中的依赖（不用写版本号，都满足） conda create -n snpe python=3.6 三、修改Makefile....

读写锁原理解读

标签： java 开发语言

读写锁是一对互斥锁，分为读锁和写锁。读锁和写锁互斥，让一个线程在进行读操作时，不允许其他线程的写操作，但是不影响其他线程的读操作；当一个线程在进行写操作时，不允许任何线程进行读操作或者写操作。...

【深度学习部署】安卓设备配置SNPE 1.68运行环境

标签：深度学习算法边缘计算

最近在学习深度学习模型部署，踩过了很多坑，写一些学习笔记以供参考交流。

onnxruntime使用GPU莫名失败陷阱，巨深！！！

标签：计算机视觉目标检测机器学习

使用pytorch模型训练后将pt转换为onnx后，可以用python,java,c#等各种语言调用，使用GPU加速是多数人的选择，但cuda装过无数次，总是失败，没有任何提示，本人日思夜想不得解。经过几天努力，发现cuda缺少两个文件...

qnx 8155学习

概念： BAM：Bus Access Module，总线访问模块 BLSP：BAM Low-Speed Peripheral，低速接口的总线访问模块 QUP：Qualcomm Universal Peripheral，高通统一的外设 ...pvm：物理虚拟机，qnx侧 ...AM.

高通cDSP介绍汇总

标签：硬件架构 Qualcomm

Qualcomm CDSP

在编译tf_ops时，出现/usr/bin/ld: cannot find -ltensorflow_framework

标签： tensorflow python 深度学习

高版本下tensorflow下，在编译tf_ops时，无法进行链接动态库问题

JNI调用NoSuchMethodError: no non-static method错误

标签： JNI

NoSuchMethodError: no non-static method错误需要先查找对应的方法是否存在，例如。

[深度学习] SpaceToDepth 类

标签：深度学习 python 人工智能

也就是说，（64，1，120，160）的labels 经过 space2depth 函数，转换成了（64，64，15，20）的labels。将 labels 输入给 space2depth对象，input：（64，1，120，160）在 output 的第2维度上，按没 block_size=8，...

Could not find conda environment（有，但是没找到）

标签： conda linux 运维

出现在使用远程服务器，多用户的情况下，并想用其他用户下的环境。这样，使用1中的命令就可以找到对应的环境。1.使用以下三个命令均没有找到。在激活到相应的环境就可以了。

深度学习计算框架综述（十三）HVX 计算优化实践

标签：深度学习

本章主要介绍，如何用Hexagon DSP的HVX来优化Conv、Pooling等算子。

Hexagon DSP FastRPC简介

FastRPC框架允许客户端透明地在应用程序和DSP处理器之间进行远程方法调用。本文将介绍FastRPC架构，在HLOS上使用它，以及如何使用ION内存分配器来创建FastRPC使用的连续缓冲区。

CDSP/HVX/HTP 芯片简介与开发入门

标签： dsp开发 c语言 android

1. 简介：

AIMET工具模型量化介绍(4)

标签： AIMET

AIMET工具模型量化介绍（4）AIMET 后训练量化技术概述使用流程常见问题参考 AIMET 后训练量化技术概述来自于大量试验数据，由于近似噪声，一些 ML 模型在量化硬件上运行时显示出推理精度降低。...

Qualcomm Snapdragon Profiler使用教程(3)

标签： android

Qualcomm Snapdragon Profiler使用教程（3）1. 跟踪捕获2. 额外的要求3. 启动应用4. 跟踪捕获的基础操作5. 评估DSP性能6. 捕捉OpenCL的应用程序7. 捕获Vulkan应用程序8. 分析9. 测量时间10....捕获snapdragon驱动的设备...

JetPack指路明灯—Navigation

标签： java android python

国际惯例，官网镇楼https://developer.android.com/guide/navigation很多人在学习JetPack的时候喜欢到处找资料和各种学习的博客，但其实，官网...

我做算法工作的小反思！

标签：算法大数据编程语言

干货作者：努力的伍六七，算法工程师来源丨https://zhuanlan.zhihu.com/p/363354912编辑丨极市平台极市导读本文是作者在算法岗位上的工作反思，含算法篇和...

骁龙神经处理引擎SDK参考指南（31）

标签： linux 运维服务器

如果运行使用输入张量的输入列表，则 snpe-diagview 报告的计时信息是整个输入集的平均值。snpe-dlc-graph-prepare 用于对量化 dlc 执行离线图形准备，以在 DSP/HTP 运行时上运行。**注意：**输出张量和层可以单独...

模型量化（Model Quantization）

推理加速库：GEMMLOWP , Intel MKL-DNN , ARM CMSIS , Qualcomm SNPE , Nvidia TensorRT 降低模型复杂度的方法->降低权重和激活输出的精度要求-----int8，int16量化 1.优点无需重训练几乎不会有精度损

骁龙神经处理引擎SDK参考指南（28）

标签：深度学习人工智能

在网络执行期间可以在 SNPE 中启用日志记录。强烈建议在程序开始时启用一次日志记录，以捕获所有进程的日志。启用日志记录可能会对性能产生影响。

【性能比较】关于pytorch中的unsample和反卷积的耗时

标签： pytorch 深度学习 python

import time transpose_conv = nn.ConvTranspose2d( in_channels=3, out_channels=3, kernel_size=3, stride=2, padding=1, output_padding=1) unsample = nn.Upsample(.

”SNPE“ 的搜索结果