博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[译]OpenGL像素缓冲区对象
阅读量:6671 次
发布时间:2019-06-25

本文共 6126 字,大约阅读时间需要 20 分钟。

目录

概述
创建PBO
映射PBO
例子:Streaming Texture Uploads with PBO
例子:Asynchronous Readback with PBO

概述

  OpenGL ARB_pixel_buffer_object 扩展与ARB_vertex_buffer_object.很相似。为了把像素数据你储存在缓冲区对象中,而非顶点数据,它简单地扩展了 ARB_vertex_buffer_object extension。储存像素数据的缓冲区对象称为Pixel Buffer Object (PBO). ARB_pixel_buffer_object extension借用了VBO所有的架构及API,但多了两个"target" 标签。target协助PBO储存管理器(OpenGL驱动)决定缓冲区对象的最佳位置: system 内存, AGP (共享内存)或显卡内存。Target标志指定PBO的两种不同的操作:GL_PIXEL_PACK_BUFFER_ARB 传递像素数据到PBO中。或GL_PIXEL_UNPACK_BUFFER_ARB 从PBO中传回数据。

  例如,glReadPixels()和glGetTexImage()是"pack"像素操作, glDrawPixels(), glTexImage2D() ,glTexSubImage2D() 是"unpack" 操作。当一个PBO的标志为GL_PIXEL_PACK_BUFFER_ARB, glReadPixels()从OpenGL的一个帧缓冲区读取数亿,并将数据写(pack)入PBO中。当一个PBO的标志为GL_PIXEL_UNPACK_BUFFER_ARB时, glDrawPixels()从PBO读取(unpack)像素数据并复制到OpenGL帧缓冲区中。PBO的主要优势是可以快速地传递像素数据通过显卡的DMA (Direct Memory Access) 而涉及CPU循环。另一个优势是它有异步DMA传输。让我们对比使用PBO后的纹理传送方法。左侧图是从图像文件或视频中加载纹理。首先,资源被加载到系统内存中,然后使用glTexImage2D()函数从系统内存复制到OpenGL纹理对象中。这两次数据传输(加载和复制)完全由CPU执行。

不用PBO中加载纹理

从PBO中加载纹理

  右侧图中,图像可直接加载到PBO中。CPU加载资源到PBO中,但不用从PBO传递像素信息到纹理对象中。GPU (OpenGL driver)从一个PBO复制数据到一个纹理对象中。OpenGL使用了DMA转送操作,而没有等CPU循环。OpenGL使用了异步的DMA传输方法。因此,glTexImage2D()立刻返回,CPU可以做其它事,而不用等待像素传送完毕。 

  下面有两个主要的PBO方法,用来提升像素传送性能:streaming texture update 和 asynchronous read-back from the framebuffer.

创建PBO

  以前说到,Pixel Buffer Object使用VBO的所有API。不同点仅再两个针对PBO的额外标志:GL_PIXEL_PACK_BUFFER_ARB和GL_PIXEL_UNPACK_BUFFER_ARB. GL_PIXEL_PACK_BUFFER_ARB 从OpenGL传送像素数据到你的程序中, GL_PIXEL_UNPACK_BUFFER_ARB 将像素数据从程序传送到OpenGL中。OpenGL使用这些标志,来决定PBO最付款的内存位置。如,uploading(unpack)时,使用显卡内存。读帧缓冲区时,使用系统内存。然而,此target标志是唯一参照。OpenGL 驱动决定PBO的位置。

  创建一个PBO需要三个步骤:    1使用glGenBuffersARB()新建一个缓冲区对象    2使用glBindBufferARB()绑定一个缓冲区对象    3使用glBufferDataARB复制像素信息到缓冲区对象

  如果你使用了一个空指针,指向glBufferDataARB的数据源数组,那么PBO只按数据的大小分配内存空间。glBufferDataARB最后一个参数是PBO的一个提示信息,它告诉如何使用些缓冲区对象。GL_STREAM_DRAW_ARB 是 streaming texture upload 。 GL_STREAM_READ_ARB 是异步的帧缓冲区read-back。

更多细节,参见VBO。

 

PBO映射

   PBO提供了内存映射机制,映射OpenGL控制的缓冲区对象到客户端的内存地址空间中。客户端可以使用glMapBufferARB(), glUnmapBufferARB()函数修改部分缓冲区对象或全部。

void* glMapBufferARB(GLenum target, GLenum access)
GLboolean glUnmapBufferARB(GLenum target)
   glMapBufferARB()返回一个指针,指向缓冲区对象,如果成功返回此指针,否则返回NULL。Target参数是GL_PIXEL_PACK_BUFFER_ARB 或GL_PIXEL_UNPACK_BUFFER_ARB。第二个参数,指定映射的缓冲区的访问方式:从BPO中读数据(GL_READ_ONLY_ARB),写数据到BPO中(GL_WRITE_ONLY_ARB) 或(GL_READ_WRITE_ARB)。
   注意如果GPU仍使用此缓冲区对象,glMapBufferARB()不会返回,直到GPU完成了对对应缓冲区对象的操作。为了避免等待,在使用glMapBufferARB之前,使用glBufferDataARB,并传入参数NULL。然后,OpenGL将废弃旧的缓冲区,为缓冲区分配新的内存。 缓冲区对象必须取消映射,可使用glUnmapBufferARB()。如果成功,glUnmapBufferARB()返回GL_TRUE 否则返回GL_FALSE。
例子:Streaming Texture Uploads

源码下载: .

    这个例子使用PBO,上传(uppack)streaming textures到OpenGL texture object using PBO.你可以切换不两只的传送模式:单个PBO,两个PBOs ,无PBO)。对比它们之间效率的差异。

    在BPO模式下,在每帧中,通过映射的PBO指接写入纹理。然后,这些纹理数据使用glTexSubImage2D()函数,从PBO传送到纹理对象中。使用PBO,OpenGL可以在PBO和纹理对象之间执行异步DMA传输。这显著提长了纹理重新载入的性能。如果显卡支持异步的DMA操作,glTexSubImage2D()会立即返回。CPU无需等待纹理拷贝,便可以做其它事情。

Streaming texture uploads with 2 PBOs

为了最大化提升streaming传输性能,你可以使用多个PBO。 图中显示出两个PBO正被同时使用。glTexSubImage2D()从一个PBO复制数据,当纹理被写入另一个PBO时。在第n帧时,PBO1被glTexSubImage2D()函数使用。PBO2用于得到新的纹理。在第n+1帧时,2个PBO交换角色,并继续更新纹理。因为DMA传输的异步性,更新和复制可被同时执行。CPU更新纹理到一个PBO中,当GPU从另一个PBO中复制纹理时。

// "index" is used to copy pixels from a PBO to a texture object  // "nextIndex" is used to update pixels in the other PBO  index = (index + 1) % 2;  nextIndex = (index + 1) % 2;    // bind the texture and PBO  glBindTexture(GL_TEXTURE_2D, textureId);  glBindBufferARB(GL_PIXEL_UNPACK_BUFFER_ARB, pboIds[index]);    // copy pixels from PBO to texture object  // Use offset instead of ponter.  glTexSubImage2D(GL_TEXTURE_2D, 0, 0, 0, WIDTH, HEIGHT,                  GL_BGRA, GL_UNSIGNED_BYTE, 0);      // bind PBO to update texture source  glBindBufferARB(GL_PIXEL_UNPACK_BUFFER_ARB, pboIds[nextIndex]);    // Note that glMapBufferARB() causes sync issue.  // If GPU is working with this buffer, glMapBufferARB() will wait(stall)  // until GPU to finish its job. To avoid waiting (idle), you can call  // first glBufferDataARB() with NULL pointer before glMapBufferARB().  // If you do that, the previous data in PBO will be discarded and  // glMapBufferARB() returns a new allocated pointer immediately  // even if GPU is still working with the previous data.  glBufferDataARB(GL_PIXEL_UNPACK_BUFFER_ARB, DATA_SIZE, 0, GL_STREAM_DRAW_ARB);    // map the buffer object into client's memory  GLubyte* ptr = (GLubyte*)glMapBufferARB(GL_PIXEL_UNPACK_BUFFER_ARB,                                          GL_WRITE_ONLY_ARB);  if(ptr)  {      // update data directly on the mapped buffer      updatePixels(ptr, DATA_SIZE);      glUnmapBufferARB(GL_PIXEL_UNPACK_BUFFER_ARB); // release the mapped buffer  }    // it is good idea to release PBOs with ID 0 after use.  // Once bound with 0, all pixel operations are back to normal ways.  glBindBufferARB(GL_PIXEL_UNPACK_BUFFER_ARB, 0);

例子:异步Read-back

下载源码:

   

   这个例子从帧缓冲区(左侧图)读取像素数据到PBO中,之后在右侧窗体中画出来,并修改图像的亮度。你可以按控格键打开或关闭PBO,来测试glReadPixels()函数的性能差异。传统的glReadPixels()阻塞渲染管线,直到所有的像素传输完毕。然后,它把控制权交给程序。使用PBO的glReadPixels()可使用异步DMA传输,立即返回,无需等待。因此程序(CPU)可执行其它操作,当GPU传输数据时。

Asynchronous glReadPixels() with 2 PBOs

此例子使用2个PBO。在第n帧时,程序使用glReadPixels()从OpenGL读取像素信息到PBO1中,在PBO2 中处理像素数据。读数据和处理数据是同时进行的。因为glReadPixels()在PBO1上立即返回,CPU可以在PBO2中处理数据而没有延迟。我们在每一帧中交换PBO1和PBO2。

// "index" is used to read pixels from framebuffer to a PBO  // "nextIndex" is used to update pixels in the other PBO  index = (index + 1) % 2;  nextIndex = (index + 1) % 2;    // set the target framebuffer to read  glReadBuffer(GL_FRONT);    // read pixels from framebuffer to PBO  // glReadPixels() should return immediately.  glBindBufferARB(GL_PIXEL_PACK_BUFFER_ARB, pboIds[index]);  glReadPixels(0, 0, WIDTH, HEIGHT, GL_BGRA, GL_UNSIGNED_BYTE, 0);    // map the PBO to process its data by CPU  glBindBufferARB(GL_PIXEL_PACK_BUFFER_ARB, pboIds[nextIndex]);  GLubyte* ptr = (GLubyte*)glMapBufferARB(GL_PIXEL_PACK_BUFFER_ARB,                                          GL_READ_ONLY_ARB);  if(ptr)  {      processPixels(ptr, ...);      glUnmapBufferARB(GL_PIXEL_PACK_BUFFER_ARB);  }    // back to conventional pixel operation  glBindBufferARB(GL_PIXEL_PACK_BUFFER_ARB, 0);

 

原文链接:

中文翻译:

wiki:

 

转载地址:http://qylxo.baihongyu.com/

你可能感兴趣的文章
powershell常用
查看>>
[transferred] javascript exception handling.
查看>>
CoreOS实践(2)—在coreos上安装Kubernetes
查看>>
java学习 第四天 数组
查看>>
[SRM577]BoardPainting
查看>>
活用C++模板之traits
查看>>
二分图匹配学习记录
查看>>
TFS安装与管理
查看>>
[WorldWind学习]15.模型加载
查看>>
java发送短信
查看>>
c#学习笔记02——接口
查看>>
Html.Encode
查看>>
P4491 [HAOI2018] 染色
查看>>
HDOJ_ACM_Piggy-Bank
查看>>
【ZJOI2012】灾难
查看>>
如何通过使用Xmanager的图形化界面修改系统
查看>>
数据库MongoDB查询语句--持续更新
查看>>
ios 应用内支付(In-App Purchase,沙盒测试,后台验证)iap
查看>>
noi 1996 登山
查看>>
HDU 3625 第一类斯特林数
查看>>