OpenGL ES3.1使用计算着色器(Compute Shader)_opengl es计算着色器-程序员宅基地

技术标签: OpenGL ES  Android  

OpenGL ES3.1使用计算着色器(Compute Shader)

1.基本介绍

OpenGL ES从3.1版本开始支持计算着色器
        工作模型有全局工作组和本地工作组,全局工作组包含由三维的本地工作组组成,本地工作组也由三个维度组成。本地工作组三个维度大小分别为:local_size_xlocal_size_ylocal_size_z
一个什么都不做的着色器最基本代码:

#version 310 es
layout(local_size_x=32,local_size_y=32) in;//设置本地工作组大小,local_size_z未设置默认为1
void main(void){
   
    
	//执行代码
}

2.创建、编译和链接计算着色器

创建计算着色器和顶点着色器、片元着色器过程差不多。

shader=glCreateShader(GL_COMPUTE_SHADER);//使用GL_COMPUTE
glShaderSource(shader,1,sourece,NULL);
glCompileShader(shader);
program=glCreateProgram();
glAttachShader(program,shader);
glLinkProgram(program);

3.执行计算着色器

当然要先使用glUseProgram(program)
3.1使用glDispatchCompute(GLuint num_groups_x,GLuint num_groups_y,GLuint num_groups_z)设置全局工作组大小并且执行计算着色器。
3.2使用glDispatchComputeIndirect(GLintptr indirect)使用存储在缓冲区对象参数来设置全局工作组大小并且执行计算着色器。
通过绑定GL_DISPATCH_INDIRECT_BUFFER缓冲对象来设置全局参数,缓冲对象由三个无符号整数(GLuint)来设置。indirect参数是当前绑定到 GL_DISPATCH_INDIRECT_BUFFER 目标的缓冲区的字节偏移量。

4.获取着色器属性

glGetProgramiv (GLuint program, GLenum pname, GLint *params)
pname:可为GL_MAX_COMPUTE_WORK_GROUP_SIZE

5.每个计算单元的位置

const uvec3 gl_WorkGroupSize;//本地工作组大小
in uvec3 gl_NumWorkGroups;//全局工作组大小
in uvec3 gl_LocalInvocationID;//表示当前执行单元在本地工作组中的位置
in uvec3 gl_WorkGroupID;//表示当前本地工作组在全局工作组中的位置
in uvec3 gl_GlobalInvocationID;//等于gl_WorkGroupID*gl_WorkGroupSize+gl_LocalInvocationID,所以它是当前执行单元的三维索引
in uint gl_LocalInvocationIndex;//它是gl_LocalInvocationID的一种扁平化方式,等于gl_LocalInvocationID.z*gl_WorkGroupSize.x*gl_WorkGroupSize.y+gl_LocalInvocationID.y*gl_WorkGroupSize.x+gl_LocalInvocationID.x

6.同步

同步类型有两种运行屏障(execution barrier)和内存屏障(memory barrier)

6.1运行屏障(execution barrier)

计算着色器程序中使用barrier()触发,如果计算着色器的一个请求遇到了barrier(),那么它就会停止运行,并等待同一本地工作组的所有请求到达为止,这一点在条件语句中使用尤为需要注意避免死锁。

6.2内存屏障(memory barrier)

        最基本的版本就是memoryBarrier(),它可以保证着色器的请求内存的写入操作一定提交到内存端,而不是通过缓冲区(cache)或者调度队列之类的方式。它还可以给着色器编译器做出指示,让它不要对内存操作重排序,以免因此跨越屏障函数。
        memoryBarrierAtomicCounter()会等待原子计数器更新,然后继续执行。
        memoryBarrierBuffer()和memoryBarrierImage()会等待缓存和图像变量的写入操作完成,然后继续执行。
        memoryBarrierShared()会等待带有shared限定符的变量更新,然后继续执行。

7.使用计算着色器写一个百万粒子发射器

7.1着色器代码

顶点着色器

#version 310 es
precision mediump image2D;//OpenGL ES要求显示定义image2D的精度
layout (binding = 1,rgba32f) restrict uniform image2D position_buffer;
uniform mat4 mvp;
out float intensity;//粒子年龄值
void main() {
   
    
    ivec2 size=imageSize(position_buffer);
    vec4 pos=imageLoad(position_buffer,ivec2(gl_VertexID%size.y,gl_VertexID/size.y));//将一维坐标转换为图像二维坐标
    gl_Position=mvp*vec4(pos.xyz,1.0f);
    intensity=pos.w;
}

片元着色器

#version 310 es
precision mediump float;
out vec4 color;
//这个值来自顶点着色器中读取的粒子年龄值
in float intensity;
void main(void){
   
    
    //根据粒子的年龄,在热红色到冷蓝色之间的混合结果
    color=mix(vec4(0.0f,0.2f,1.0f,1.0f),vec4(0.2f,0.05f,0.0f,1.0f),intensity);
}

计算着色器

#version 310 es
precision mediump image2D;//OpenGL ES要求显示定义image2D的精度
//uniform块中包含引力器的位置和质量
layout (std140,binding=0) uniform attractor_block{
   
    
    vec4 attractor[64];//xyz=position,w=mass
};
//每块中粒子的数量为128
layout (local_size_x=128) in;
//使用两个缓冲来包含粒子的位置和速度信息
layout (binding = 0,rgba32f) restrict uniform image2D velocity_buffer;
layout (binding = 1,rgba32f) restrict uniform image2D position_buffer;
//时间间隔
uniform float dt;
void main(void){
   
    
    //从缓存中读取当前的位置和速度
    ivec2 size=imageSize(velocity_buffer);
    ivec2 p=ivec2(int(gl_GlobalInvocationID.x)/size.y,int(gl_GlobalInvocationID.x)%size.y);
    vec4 vel=imageLoad(velocity_buffer,p);
    vec4 pos=imageLoad(position_buffer,p);
    int i;
    //使用当前速度x时间来更新位置
    pos.xyz += vel.xyz * dt;
    pos.w -= 0.0001 * dt;
    //对于每个引力器
    for (i = 0; i < 4; i++)
    {
   
    
        //计算受力并更新速度
        vec3 dist = (attractor[i].xyz - pos.xyz);
        vel.xyz += dt * dt * attractor[i].w * normalize(dist) / (dot(dist, dist) + 10.0);
    }
    //如果粒子已经过期,那么重置它
    if (pos.w <= 0.0)
    {
   
    
        pos.xyz = vec3(0.0f);
        vel.xyz *= 0.01;
        pos.w += 1.0f;
    }

    //将新的位置和速度信息重新保存在缓存中
    imageStore(position_buffer,p,pos);
    imageStore(velocity_buffer,p,vel);
}

7.2粒子系统初始化

	srand(clock());
    glEnable(GL_BLEND);
    glBlendFunc(GL_ONE, GL_ONE);
    //激活计算着色器,
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_39561000/article/details/103112147

智能推荐

c# 调用c++ lib静态库_c#调用lib-程序员宅基地

文章浏览阅读2w次,点赞7次,收藏51次。四个步骤1.创建C++ Win32项目动态库dll 2.在Win32项目动态库中添加 外部依赖项 lib头文件和lib库3.导出C接口4.c#调用c++动态库开始你的表演...①创建一个空白的解决方案,在解决方案中添加 Visual C++ , Win32 项目空白解决方案的创建:添加Visual C++ , Win32 项目这......_c#调用lib

deepin/ubuntu安装苹方字体-程序员宅基地

文章浏览阅读4.6k次。苹方字体是苹果系统上的黑体,挺好看的。注重颜值的网站都会使用,例如知乎:font-family: -apple-system, BlinkMacSystemFont, Helvetica Neue, PingFang SC, Microsoft YaHei, Source Han Sans SC, Noto Sans CJK SC, W..._ubuntu pingfang

html表单常见操作汇总_html表单的处理程序有那些-程序员宅基地

文章浏览阅读159次。表单表单概述表单标签表单域按钮控件demo表单标签表单标签基本语法结构<form action="处理数据程序的url地址“ method=”get|post“ name="表单名称”></form><!--action,当提交表单时,向何处发送表单中的数据,地址可以是相对地址也可以是绝对地址--><!--method将表单中的数据传送给服务器处理,get方式直接显示在url地址中,数据可以被缓存,且长度有限制;而post方式数据隐藏传输,_html表单的处理程序有那些

PHP设置谷歌验证器(Google Authenticator)实现操作二步验证_php otp 验证器-程序员宅基地

文章浏览阅读1.2k次。使用说明:开启Google的登陆二步验证(即Google Authenticator服务)后用户登陆时需要输入额外由手机客户端生成的一次性密码。实现Google Authenticator功能需要服务器端和客户端的支持。服务器端负责密钥的生成、验证一次性密码是否正确。客户端记录密钥后生成一次性密码。下载谷歌验证类库文件放到项目合适位置(我这边放在项目Vender下面)https://github.com/PHPGangsta/GoogleAuthenticatorPHP代码示例://引入谷_php otp 验证器

【Python】matplotlib.plot画图横坐标混乱及间隔处理_matplotlib更改横轴间距-程序员宅基地

文章浏览阅读4.3k次,点赞5次,收藏11次。matplotlib.plot画图横坐标混乱及间隔处理_matplotlib更改横轴间距

docker — 容器存储_docker 保存容器-程序员宅基地

文章浏览阅读2.2k次。①Storage driver 处理各镜像层及容器层的处理细节,实现了多层数据的堆叠,为用户 提供了多层数据合并后的统一视图②所有 Storage driver 都使用可堆叠图像层和写时复制(CoW)策略③docker info 命令可查看当系统上的 storage driver主要用于测试目的,不建议用于生成环境。_docker 保存容器

随便推点

网络拓扑结构_网络拓扑csdn-程序员宅基地

文章浏览阅读834次,点赞27次,收藏13次。网络拓扑结构是指计算机网络中各组件(如计算机、服务器、打印机、路由器、交换机等设备)及其连接线路在物理布局或逻辑构型上的排列形式。这种布局不仅描述了设备间的实际物理连接方式,也决定了数据在网络中流动的路径和方式。不同的网络拓扑结构影响着网络的性能、可靠性、可扩展性及管理维护的难易程度。_网络拓扑csdn

JS重写Date函数,兼容IOS系统_date.prototype 将所有 ios-程序员宅基地

文章浏览阅读1.8k次,点赞5次,收藏8次。IOS系统Date的坑要创建一个指定时间的new Date对象时,通常的做法是:new Date("2020-09-21 11:11:00")这行代码在 PC 端和安卓端都是正常的,而在 iOS 端则会提示 Invalid Date 无效日期。在IOS年月日中间的横岗许换成斜杠,也就是new Date("2020/09/21 11:11:00")通常为了兼容IOS的这个坑,需要做一些额外的特殊处理,笔者在开发的时候经常会忘了兼容IOS系统。所以就想试着重写Date函数,一劳永逸,避免每次ne_date.prototype 将所有 ios

如何将EXCEL表导入plsql数据库中-程序员宅基地

文章浏览阅读5.3k次。方法一:用PLSQL Developer工具。 1 在PLSQL Developer的sql window里输入select * from test for update; 2 按F8执行 3 打开锁, 再按一下加号. 鼠标点到第一列的列头,使全列成选中状态,然后粘贴,最后commit提交即可。(前提..._excel导入pl/sql

Git常用命令速查手册-程序员宅基地

文章浏览阅读83次。Git常用命令速查手册1、初始化仓库git init2、将文件添加到仓库git add 文件名 # 将工作区的某个文件添加到暂存区 git add -u # 添加所有被tracked文件中被修改或删除的文件信息到暂存区,不处理untracked的文件git add -A # 添加所有被tracked文件中被修改或删除的文件信息到暂存区,包括untracked的文件...

分享119个ASP.NET源码总有一个是你想要的_千博二手车源码v2023 build 1120-程序员宅基地

文章浏览阅读202次。分享119个ASP.NET源码总有一个是你想要的_千博二手车源码v2023 build 1120

【C++缺省函数】 空类默认产生的6个类成员函数_空类默认产生哪些类成员函数-程序员宅基地

文章浏览阅读1.8k次。版权声明:转载请注明出处 http://blog.csdn.net/irean_lau。目录(?)[+]1、缺省构造函数。2、缺省拷贝构造函数。3、 缺省析构函数。4、缺省赋值运算符。5、缺省取址运算符。6、 缺省取址运算符 const。[cpp] view plain copy_空类默认产生哪些类成员函数

推荐文章

热门文章

相关标签