cocos2d3.2 渲染优化机制

好久没写BLOG了,也是这一年都在项目上混,没什么时间去学习其他的东西,刚好最近闲下来了,就开始研究cocos2d了。最近学习了下它的渲染模式,和大家分享一下,其实具体的流程网上教程一抓一大把,我只是用几个例子来分析一下。

例子一:

for(int i=0;i<100;i++){
		Sprite* sprite1 = Sprite::create("CloseNormal.png");
		sprite1->setPosition(origin.x+sprite1->getContentSize().width/2 * (i%10),origin.y+sprite1->getContentSize().height/2*(i%10));
		this->addChild(sprite1);
}

结果:


渲染次数竟然仅仅为1(怎么说也应该是2来着,也许并没有把那几个标签的渲染算进来,不过这并不是今天的重点),我们绘制了100个精灵,竟然只调用了一次渲染命令。这是3.0以后版本的一个优化特性

从Cocos2d-x3.0开始,Cocos2d-x引入了新的渲染流程,它不像2.x版本直接在每一个node中的draw函数中直接调用OpenGL代码进行图形渲染,而是通过各种RenderCommand封装起来,然后添加到一个CommandQueue队列里面去,而现在draw函数的作用就是在此函数中设置好相对应的RenderCommand参数,然后把此RenderCommand添加到CommandQueue中。最后在每一帧结束时调用renderer函数进行渲染,在renderer函数中会根据ID对RenderCommand进行排序,然后才进行渲染。(尽情的copy!!!)。大概就是先访问每一个节点,节点决定自己如何渲染,加什么命令自己决定,放到渲染队列中,当访问完了所有节点,再开始进行真正的渲染--执行各个节点加入进来的命令。

渲染命令RenderCommand分成以下几种:TrianglesCommand,QuadCommand,MeshCommand,GroupCommand,BatchCommand,PrimitiveCommand。真正对精灵绘制的只是QuadCommand这种渲染命令。

当访问到的命令是QuadCommand时,是如何处理的呢?看源码吧。

 //Draw if we have batched other commands which are not quad command   flush掉之前的所有绘图命令
        flush3D();
        flushTriangles();
        
        //Process quad command
        auto cmd = static_cast<QuadCommand*>(command);
        
        //Draw batched quads if necessary 如果顶点数量超过了VBO所限制的顶点数量,马上进行绘制。
        if(cmd->isSkipBatching()|| (_numberQuads + cmd->getQuadCount()) * 4 > VBO_SIZE )
        {
            CCASSERT(cmd->getQuadCount()>= 0 && cmd->getQuadCount() * 4 < VBO_SIZE,"VBO for vertex is not big enough,please break the data down or use customized render command");
            //Draw batched quads if VBO is full
            drawBatchedQuads();
        }
        
        //Batch Quads
        _batchQuadCommands.push_back(cmd);
        
        fillQuads(cmd);
        
        if(cmd->isSkipBatching())
        {
            drawBatchedQuads();//真正执行绘制精灵的操纵
        }

那么接下来看看drawBatchedQuads是如何执行的。

void Renderer::drawBatchedQuads()
{
   //..........省略部分代码......这里忽略的 一些opengl的操作,大概就是进行一些顶点数据和顶点索引数据的绑定,要不要采用VAO方式
    //Start drawing verties in batch
    for(const auto& cmd : _batchQuadCommands)
    {
        auto newMaterialID = cmd->getMaterialID();
        if(_lastMaterialID != newMaterialID || newMaterialID == MATERIAL_ID_DO_NOT_BATCH)
        {
            //Draw quads
            if(indexToDraw > 0)
            {
                glDrawElements(GL_TRIANGLES,(GLsizei) indexToDraw,GL_UNSIGNED_SHORT,(GLvoid*) (startIndex*sizeof(_indices[0])) );
                _drawnBatches++;
                _drawnVertices += indexToDraw;
                
                startIndex += indexToDraw;
                indexToDraw = 0;
            }
            //Use new material
            cmd->useMaterial();
            _lastMaterialID = newMaterialID;
        }
        indexToDraw += cmd->getQuadCount() * 6;
    }
    //..........省略部分代码......
}
这里我们很高兴看到了_lastMaterialID 和newMaterialID;这里就是看如果多条命令的“渲染纹理”是一样的那么就把它们放在一起渲染,只调用一次glDrawElements命令,

那么命令的"渲染纹理"是否是一样的取决于什么呢?我们看QuadCommand是如何生成materialId的。

int glProgram = (int)_glProgramState->getGLProgram()->getProgram();
int intArray[4] = { glProgram,(int)_textureID,(int)_blendType.src,(int)_blendType.dst};
_materialID = XXH32((const void*)intArray,sizeof(intArray),0);
原来是着色器 ,纹理ID,混合模式的一个HASH,所以两条命令的materialId要一样,必须保证这些都是一样的。


所以现在就很容易理解为什么例子一为什么是1了吧。

例子二

for(int i=0;i<100;i++){
Sprite* sprite1 = Sprite::create("CloseNormal.png");
Sprite* sprite2 = Sprite::create("CloseSelected.png");
sprite1->setPosition(origin.x+sprite1->getContentSize().width/2 * (i%10),origin.y+sprite1->getContentSize().height/2*(i%10));
spite2->setPosition(origin.x+sprite2->getContentSize().width/2 * (i%10),origin.y+visibleSize.height-sprite2->getContentSize().height/2*(i%10));
this->addChild(sprite1);
this->addChild(sprite2);
}

结果:

what????感觉不会再爱了。。。

怎么又变成了200了,难道不是2么。之前的结论是:连续几条命令的“渲染纹理”是一样的,那么就会放在一起进行渲染,那么命令队列的命令是如何一次加进来的呢?现在要从Scene的渲染开始说起,Scene的render是在程序循环中一直在调用的,所有节点的访问都从这里开始。

void Scene::render(Renderer* renderer)
{
    auto director = Director::getInstance();
    Camera* defaultCamera = nullptr;
    const auto& transform = getNodeToParentTransform();
    if (_cameraOrderDirty)
    {
        stable_sort(_cameras.begin(),_cameras.end(),camera_cmp);
        _cameraOrderDirty = false;
    }
    
    for (const auto& camera : _cameras)
    {
        if (!camera->isVisible())
            continue;
        
        Camera::_visitingCamera = camera;
        if (Camera::_visitingCamera->getCameraFlag() == CameraFlag::DEFAULT)
        {
            defaultCamera = Camera::_visitingCamera;
        }
        
        director->pushMatrix(MATRIX_STACK_TYPE::MATRIX_STACK_PROJECTION);
        director->loadMatrix(MATRIX_STACK_TYPE::MATRIX_STACK_PROJECTION,Camera::_visitingCamera->getViewProjectionMatrix());
        
        //visit the scene
        visit(renderer,transform,0);
        renderer->render();
        
        director->popMatrix(MATRIX_STACK_TYPE::MATRIX_STACK_PROJECTION);
    }

    Camera::_visitingCamera = nullptr;
}

visit(renderer,0);就是访问所有节点及其子节点,加入rendercommand。renderer->render()就是去执行这些rendercommand队列。在visit中有这么一句:

sortAllChildren()
在访问该节点和子节点之前会对所有节点进行排序,排序的规则是:

bool nodeComparisonLess(Node* n1,Node* n2)
{
    return( n1->getLocalZOrder() < n2->getLocalZOrder() ||
           ( n1->getLocalZOrder() == n2->getLocalZOrder() && n1->getOrderOfArrival() < n2->getOrderOfArrival() )
           );
}
在该节点中的深度(优先)和到达的时间。

知道了这点就可以解释例子二了。在相邻两次用同一张图片去创建精灵之间插入了另外一张图片去创建精灵,由于我们没有指定localZorder,所以所有精灵都是默认localZorder,而到达时间就被分割开了,所以不能用优化的方案去绘制精灵。我们稍微改一下代码就可以马上让绘制次数变成2:(指定同一张图片的精灵的localZorder一样)。

for(int i=0;i<100;i++){
	Sprite* sprite1 = Sprite::create("CloseNormal.png");
	Sprite* sprite2 = Sprite::create("CloseSelected.png");
	sprite1->setPosition(origin.x+sprite1->getContentSize().width/2 * (i%10),origin.y+sprite1->getContentSize().height/2*(i%10));
	sprite2->setPosition(origin.x+sprite2->getContentSize().width/2 * (i%10),origin.y+visibleSize.height-sprite2->getContentSize().height/2*(i%10));
	this->addChild(sprite1,0);
	this->addChild(sprite2,1);
}

例子3:

SpriteFrameCache::getInstance()->addSpriteFramesWithFile("close.plist");

	for(int i=0;i<100;i++){
<span style="white-space:pre">	</span>Sprite* sprite1 = Sprite::createWithSpriteFrameName("CloseNormal.png");
<span style="white-space:pre">	</span>Sprite* sprite2 = Sprite::createWithSpriteFrameName("CloseSelected.png");
<span style="white-space:pre">	</span>sprite1->setPosition(origin.x+sprite1->getContentSize().width/2 * (i%10),origin.y+sprite1->getContentSize().height/2*(i%10));
<span style="white-space:pre">	</span>sprite2->setPosition(origin.x+sprite2->getContentSize().width/2 * (i%10),origin.y+visibleSize.height-sprite2->getContentSize().height/2*(i%10));
<span style="white-space:pre">	</span>this->addChild(sprite2);
<span style="white-space:pre">	</span>this->addChild(sprite1);
}
结果:
渲染次数变成了1。
这里是采用精灵帧的方式去创建精灵。大家已经很熟悉了吧。我将CloseNormal.png和CloseSelected.png和并到了一起 生成了一个 close.plist文件和close.png,这个估计大家都会了吧,plist 文件就是描述了之前两个图片在这张大图中的位置和大小。
使用精灵帧创建的精灵使用的是这张大图为纹理,这里不同图片的精灵只是使用的纹理位置不一样而已,所以不需要进行纹理切换,也就只进行了一个渲染,将所有的渲染命令都放在了一起

例子4:
for(int i=0;i<100;i++){
	Sprite* sprite1 = Sprite::create("CloseNormal.png");
	Sprite* sprite2 = Sprite::create("CloseSelected.png");
	sprite1->setPosition(origin.x+sprite1->getContentSize().width/2 * (i%10),origin.y+visibleSize.height-sprite2->getContentSize().height/2*(i%10));
	this->addChild(sprite1);
	this->addChild(sprite2);
	sprite1->setGlobalZOrder(1);
}

效果:

这里就要讨论到节点的globalZorder了,其实渲染顺序不仅仅和localZorder和arrival有关,和globalZorder也有关系,在开始渲染之前会对每个渲染队列进行排序:由于渲染队列本身就会有5个数组,分别对应0---4
enum QUEUE_GROUP
    {
        /**Objects with globalZ smaller than 0.*/
        GLOBALZ_NEG = 0,/**Opaque 3D objects with 0 globalZ.*/
        OPAQUE_3D = 1,/**Transparent 3D objects with 0 globalZ.*/
        TRANSPARENT_3D = 2,/**2D objects with 0 globalZ.*/
        GLOBALZ_ZERO = 3,/**Objects with globalZ bigger than 0.*/
        GLOBALZ_POS = 4,QUEUE_COUNT = 5,};

globalZorder<0的放在GLOBALZ_NEG 对应的数组中,globalZorder>0的放在GLOBALZ_POS 对应的数组中,而globalZorder=0的要根据命令自身的属性决定放在其它三个中的哪一个对应的数组中,前二个数组需要排序,排序规则是:
static bool compareRenderCommand(RenderCommand* a,RenderCommand* b)
{
    return a->getGlobalOrder() < b->getGlobalOrder();
}

所以globalZorder也会影响两个命令之间的位置关系。

总结:要优化渲染,就需要使得两个使用同一纹理的精灵绘制命令放在一起,影响它们是否放在一起的因素有:globaleZorder,localZorder,arrival。而判断是否是同一纹理的因素是:纹理ID,着色器,渲染方式。(详细请 参考各个命令的_materialID)


Over!!!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


    本文实践自 RayWenderlich、Ali Hafizji 的文章《How To Create Dynamic Textures with CCRenderTexture in Cocos2D 2.X》,文中使用Cocos2D,我在这里使用Cocos2D-x 2.1.4进行学习和移植。在这篇文章,将会学习到如何创建实时纹理、如何用Gimp创建无缝拼接纹
Cocos-code-ide使用入门学习地点:杭州滨江邮箱:appdevzw@163.com微信公众号:HopToad 欢迎转载,转载标注出处:http://blog.csdn.netotbaron/article/details/424343991.  软件准备 下载地址:http://cn.cocos2d-x.org/download 2.  简介2.1         引用C
第一次開始用手游引擎挺激动!!!进入正题。下载资源1:从Cocos2D-x官网上下载,进入网页http://www.cocos2d-x.org/download,点击Cocos2d-x以下的Download  v3.0,保存到自定义的文件夹2:从python官网上下载。进入网页https://www.python.org/downloads/,我当前下载的是3.4.0(当前最新
    Cocos2d-x是一款强大的基于OpenGLES的跨平台游戏开发引擎,易学易用,支持多种智能移动平台。官网地址:http://cocos2d-x.org/当前版本:2.0    有很多的学习资料,在这里我只做为自己的笔记记录下来,错误之处还请指出。在VisualStudio2008平台的编译:1.下载当前稳
1.  来源 QuickV3sample项目中的2048样例游戏,以及最近《最强大脑》娱乐节目。将2048改造成一款挑战玩家对数字记忆的小游戏。邮箱:appdevzw@163.com微信公众号:HopToadAPK下载地址:http://download.csdn.net/detailotbaron/8446223源码下载地址:http://download.csdn.net/
   Cocos2d-x3.x已经支持使用CMake来进行构建了,这里尝试以QtCreatorIDE来进行CMake构建。Cocos2d-x3.X地址:https://github.com/cocos2d/cocos2d-x1.打开QtCreator,菜单栏→"打开文件或项目...",打开cocos2d-x目录下的CMakeLists.txt文件;2.弹出CMake向导,如下图所示:设置
 下载地址:链接:https://pan.baidu.com/s/1IkQsMU6NoERAAQLcCUMcXQ提取码:p1pb下载完成后,解压进入build目录使用vs2013打开工程设置平台工具集,打开设置界面设置: 点击开始编译等待编译结束编译成功在build文件下会出现一个新文件夹Debug.win32,里面就是编译
分享一下我老师大神的人工智能教程吧。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!http://www.captainbed.net前言上次用象棋演示了cocos2dx的基本用法,但是对cocos2dx并没有作深入的讨论,这次以超级马里奥的源代码为线索,我们一起来学习超级马里奥的实
1. 圆形音量button事实上作者的本意应该是叫做“电位计button”。可是我觉得它和我们的圆形音量button非常像,所以就这么叫它吧~先看效果:好了,不多解释,本篇到此为止。(旁白: 噗。就这样结束了?)啊才怪~我们来看看代码:[cpp] viewplaincopyprint?CCContro
原文链接:http://www.cnblogs.com/physwf/archive/2013/04/26/3043912.html为了进一步深入学习贯彻Cocos2d,我们将自己写一个场景类,但我们不会走的太远,凡是都要循序渐进,哪怕只前进一点点,那也至少是前进了,总比贪多嚼不烂一头雾水的好。在上一节中我们建
2019独角兽企业重金招聘Python工程师标准>>>cocos2d2.0之后加入了一种九宫格的实现,主要作用是用来拉伸图片,这样的好处在于保留图片四个角不变形的同时,对图片中间部分进行拉伸,来满足一些控件的自适应(PS: 比如包括按钮,对话框,最直观的形象就是ios里的短信气泡了),这就要求图
原文链接:http://www.cnblogs.com/linji/p/3599478.html1.环境和工具准备Win7VS2010/2012,至于2008v2版本之后似乎就不支持了。 2.安装pythonv.2.0版本之前是用vs模板创建工程的,到vs2.2之后就改用python创建了。到python官网下载版本2.7.5的,然后
环境:ubuntu14.04adt-bundle-linux-x86_64android-ndk-r9d-linux-x86_64cocos2d-x-3.0正式版apache-ant1.9.3python2.7(ubuntu自带)加入环境变量exportANDROID_SDK_ROOT=/home/yangming/adt-bundle-linux/sdkexportPATH=${PATH}:/$ANDROID_SDK_ROOTools/export
1开发背景游戏程序设计涉及了学科中的各个方面,鉴于目的在于学习与进步,本游戏《FlappyBird》采用了两个不同的开发方式来开发本款游戏,一类直接采用win32底层API来实现,另一类采用当前火热的cocos2d-x游戏引擎来开发本游戏。2需求分析2.1数据分析本项目要开发的是一款游
原文链接:http://www.cnblogs.com/linji/p/3599912.html//纯色色块控件(锚点默认左下角)CCLayerColor*ccc=CCLayerColor::create(ccc4(255,0,0,128),200,100);//渐变色块控件CCLayerGradient*ccc=CCLayerGradient::create(ccc4(255,0,0,
原文链接:http://www.cnblogs.com/linji/p/3599488.html//载入一张图片CCSprite*leftDoor=CCSprite::create("loading/door.png");leftDoor->setAnchorPoint(ccp(1,0.5));//设置锚点为右边中心点leftDoor->setPosition(ccp(240,160));/
为了答谢广大学员对智捷课堂以及关老师的支持,现购买51CTO学院关老师的Cocos2d-x课程之一可以送智捷课堂编写图书一本(专题可以送3本)。一、Cocos2d-x课程列表:1、Cocos2d-x入门与提高视频教程__Part22、Cocos2d-x数据持久化与网络通信__Part33、Cocos2d-x架构设计与性能优化内存优
Spawn让多个action同时执行。Spawn有多种不同的create方法,最终都调用了createWithTwoActions(FiniteTimeAction*action1,FiniteTimeAction*action2)方法。createWithTwoActions调用initWithTwoActions方法:对两个action变量初始化:_one=action1;_two=action2;如果两个a
需要环境:php,luajit.昨天在cygwin上安装php和luajit环境,这真特么是一个坑。建议不要用虚拟环境安装打包环境,否则可能会出现各种莫名问题。折腾了一下午,最终将环境转向linux。其中,luajit的安装脚本已经在quick-cocos2d-x-develop/bin/中,直接luajit_install.sh即可。我的lin
v3.0相对v2.2来说,最引人注意的。应该是对触摸层级的优化。和lambda回调函数的引入(嗯嗯,不枉我改了那么多类名。话说,每次cocos2dx大更新。总要改掉一堆类名函数名)。这些特性应该有不少人研究了,所以今天说点跟图片有关的东西。v3.0在载入图片方面也有了非常大改变,仅仅只是