|
非常好的讲述OpenGL与D3D的系列文章,转载到论坛与大家分享。原文刊载地址:KlayGE游戏引擎,转载请注明该网址以及原作者gongminmin。原文地址:http://www.klayge.org/2011/07/20 ... %e9%9b%86%ef%bc%9f/
上一篇讲到了如何填平OpenGL和D3D之间一些原本被认为位于底层的区别。本篇将剖析两个API在功能上的异同,以及直接相互访问的可能性。 功能D3D9的功能早已被OpenGL 2.0所覆盖,网上可以找到很多资料,这里就不提了。本文注重的是新的GPU特性。下表列出了D3D10+的新功能,以及实现该功能所需要的OpenGL扩展或核心。 D3D 10的功能 | OpenGL所对应的 | Geomrtry shader | GL_ARB_geometry_shader4或OpenGL 3 | Stream output | GL_EXT_transform_feedback或OpenGL 3 | State对象 | 无,需要在上层封装GL_EXT_direct_state_access | Constant buffer | GL_ARB_uniform_buffer_object或OpenGL 3 | Texture array和新的资源格式 | GL_EXT_texture_array
+GL_ARB_texture_compression_rgtc
+GL_ARB_texture_rg
+GL_ARB_texture_rgb10_a2ui
+GL_EXT_texture_integer或OpenGL 3 | texture和sampler解偶 | GL_ARB_sampler_objects或OpenGL 3 | 在shader里进行整数和位操作 | GL_ARB_shader_bit_encoding或OpenGL 3 | Multisampled alpha-to-coverage | GL_NV_multisample_coverage或OpenGL 3 | D3D 10.1的功能 | OpenGL所对应的 | 读取multisample depth/stencil纹理 | GL_ARB_texture_multisample或OpenGL 3 | Cubemap array | GL_ARB_texture_cube_map_array或OpenGL 4 | gather4 | GL_ARB_texture_gather或OpenGL 4 | D3D 11的功能 | OpenGL所对应的 | Compute Shader | GL_ARB_cl_event + OpenCL | Dynamic Shader Linkage | GL_ARB_gpu_shader5或OpenGL 4 | Multithreading | 无 | Tessellation | GL_ARB_tessellation_shader或OpenGL 4 |
这些都是DX SDK文档里提到的功能,其他一些比较小的功能,也可以很容易找到OpenGL的对应。从上表可以看出,几乎所有D3D的功能都可以直接用相应的OpenGL功能代替,同时没有性能损失。需要重点讨论的是一些例外: State对象D3D 10新增了State对象,可以极大地减少由于改变渲染状态所需的系统调用次数。OpenGL中目前还没有State对象,所以只能在上层自行封装。虽然有些 性能损失,但接口可以和D3D统一起来。ARB针对OpenGL的State对象进行过旷日持久的讨论,还最终各大厂商没有达成一致。不过这是个趋势,相信不久的将来就会出个相关的扩展。到时候这个区别就能被完美地填平。 Compute ShaderD3D 11引入了compute shader,在D3D中直接提供了GPGPU的能力。OpenGL没有因此增加一种shader,而是增强和同门师弟OpenCL的互操作能力。 OpenGL和OpenCL能直接共享texture和buffer等,起到了和compute shader等价的功能。与GLSL和HLSL的关系一样,这里存在着shader语言不同的问题,而且没有Cg可以作为桥梁,目前只能写两份代码。 MultithreadingD3D 11的multithreading能力允许多个context都调用D3D11 API,每个context保存下来的API调用流可以在主context执行依次执行。OpenGL目前也没有引入该机制,需要在上层自行实现。话说回来了,目前的所有显卡 驱动都没有实现multithreading,所以所有多context都是由D3D runtime软件实现的,没有达到应有的提速效果。自己实现一个command list也能达到那样的性能。仍然希望某一天multithreading能成为OpenGL的功能 之一,简化上层的工作。 总结所以说,OpenGL和D3D功能的交集几乎就是它们的并集,并不会因为需要兼容两者而失去很多功能。从功能上说,OpenGL和D3D之间的分歧甚至小于OpenGL和OpenGL ES。破解了第一篇说的流言4。 互操作神奇扩展WGL_NV_DX_interop的出现,使得OpenGL可以正式与D3D进行互操作。(严格来说,互操作能力源自它的前身WGL_NVX_DX_interop,但鉴于他是个NVX实验性质的扩展,最好小心点用。)该扩展的目的是,在D3D中建立资源,而在 OpenGL中访问它。目前可以支持的是D3D9的纹理、render target和VB的读写。D3D10+的支持将在未来加入。两个API之间所需的同步也是自动完成的。 使用WGL_NV_DX_interop进行相互渲染的范例如下: - // 跟平常一样建立D3D设备和资源d3d->CreateDevice(..., &d3dDevice);
- d3dDevice->CreateRenderTarget(width, height, D3DFMT_A8R8G8B8, D3DMULTISAMPLE_4_SAMPLES, 0, FALSE, &dxColorBuffer, NULL);
- d3dDevice->CreateDepthStencilSurface(width, height, D3DFMT_D24S8, D3DMULTISAMPLE_4_SAMPLES, 0, FALSE, &dxDepthBuffer, NULL);// 把D3D设备注册给OpenGL
- HANDLE gl_handleD3D = wglDXOpenDeviceNV(d3dDevice);// 把D3Drender target注册成OpenGL纹理对象
- GLuint names[2];
- HANDLE handles[2];
- handles[0] = wglDXRegisterObjectNV(gl_handleD3D, dxColorBuffer, names[0], GL_TEXTURE_2D_MULTISAMPLE, WGL_ACCESS_READ_WRITE_NV);
- handles[1] = wglDXRegisterObjectNV(gl_handleD3D, dxDepthBuffer, names[0], GL_TEXTURE_2D_MULTISAMPLE, WGL_ACCESS_READ_WRITE_NV);// 现在纹理就可以当成普通的OpenGL纹理来用了
- // D3D和OpenGL渲到同一个render target
- direct3d_render_pass(); // 和平常一样进行D3D渲染
- // 锁定render target,交给OpenGL
- wglDXLockObjectsNV(handleD3D, 2, handles);
- opengl_render_pass(); // 和平常一样进行OpenGL渲染
- wglDXUnlockObjectsNV(handleD3D, 2, handles);
- direct3d_swap_buffers(); // D3D present
复制代码 这样两个API可以和谐共处了,但这个扩展目前仅限于NV的卡。
本篇讨论了两个API在功能上的交集和并集,以及互操作的方法。下一篇是本系列的结局,将讨论一些平台相关的问题,并进行系统性的总结。 |
|