1 files changed, 592 insertions, 0 deletions
diff --git a/NvBlast/sdk/toolkit/source/NvBlastTkGroupImpl.cpp b/NvBlast/sdk/toolkit/source/NvBlastTkGroupImpl.cpp
new file mode 100644
index 0000000..d9a4b29
--- /dev/null
+++ b/NvBlast/sdk/toolkit/source/NvBlastTkGroupImpl.cpp
@@ -0,0 +1,592 @@
+/*
+* Copyright (c) 2016-2017, NVIDIA CORPORATION.  All rights reserved.
+*
+* NVIDIA CORPORATION and its licensors retain all intellectual property
+* and proprietary rights in and to this software, related documentation
+* and any modifications thereto.  Any use, reproduction, disclosure or
+* distribution of this software and related documentation without an express
+* license agreement from NVIDIA CORPORATION is strictly prohibited.
+*/
+
+#include "NvPreprocessor.h"
+
+#include "NvBlastAssert.h"
+#include "NvBlast.h"
+
+#include "NvBlastTkFrameworkImpl.h"
+#include "NvBlastTkGroupImpl.h"
+#include "NvBlastTkActorImpl.h"
+#include "NvBlastTkFamilyImpl.h"
+#include "NvBlastTkAssetImpl.h"
+#include "NvBlastTkTaskImpl.h"
+
+#include "Px.h"
+#include "PxFileBuf.h"
+#include "PxAllocatorCallback.h"
+#include "task/PxCpuDispatcher.h"
+
+#undef max
+#undef min
+#include <algorithm>
+
+using namespace physx;
+using namespace physx::general_PxIOStream2;
+
+
+namespace Nv
+{
+namespace Blast
+{
+
+//////// Static data ////////
+
+NVBLASTTK_DEFINE_TYPE_IDENTIFIABLE(Group);
+
+
+//////// Local (static) functions ////////
+
+static uint32_t getNumThreads(PxTaskManager* tm)
+{
+	if (tm == nullptr) return 0;
+	if (tm->getCpuDispatcher() == nullptr) return 0;
+	return tm->getCpuDispatcher()->getWorkerCount();
+}
+
+
+//////// Member functions ////////
+
+TkGroupImpl::TkGroupImpl() : m_actorCount(0), m_isProcessing(false), m_sync(0)
+{
+#if NV_PROFILE
+	memset(&m_stats, 0, sizeof(TkGroupStats)); 
+#endif
+}
+
+
+TkGroupImpl::~TkGroupImpl()
+{
+	NVBLAST_ASSERT(getActorCount() == 0);
+	NVBLAST_ASSERT(m_sharedMemory.size() == 0);
+}
+
+
+void TkGroupImpl::release()
+{
+	if (isProcessing())
+	{
+		// abort all processing? 
+		NVBLASTTK_LOG_ERROR("TkGroup::release: cannot release Group while processing.");
+		NVBLAST_ALWAYS_ASSERT_MESSAGE("TkGroup::release: cannot release Group while processing.");
+		return;
+	}
+
+	for (auto it = m_sharedMemory.getIterator(); !it.done(); ++it)
+	{
+		TkFamilyImpl* family = it->first;
+		for (TkActorImpl& actor : family->getActorsInternal())
+		{
+			if (actor.m_group == this)
+			{
+				removeActorInternal(actor);
+			}
+		}
+		SharedMemory* mem = it->second;
+		mem->release();
+		NVBLASTTK_DELETE(mem, SharedMemory);
+	}
+	m_sharedMemory.clear();
+
+	m_bondTempDataBlock.release();
+	m_chunkTempDataBlock.release();
+	m_bondEventDataBlock.release();
+	m_chunkEventDataBlock.release();
+	m_splitScratchBlock.release();
+
+	NVBLASTTK_DELETE(this, TkGroupImpl);
+}
+
+
+void TkGroupImpl::addActorsInternal(TkActorImpl** actors, uint32_t numActors)
+{
+	for (uint32_t i = 0; i < numActors; i++)
+	{
+		addActorInternal(*actors[i]);
+	}
+}
+
+
+void TkGroupImpl::addActorInternal(TkActorImpl& tkActor)
+{
+	NVBLAST_ASSERT(tkActor.getGroup() == nullptr);
+	tkActor.m_group = this;
+	m_actorCount++;
+}
+
+
+bool TkGroupImpl::addActor(TkActor& actor)
+{
+	TkActorImpl& tkActor = static_cast<TkActorImpl&>(actor);
+	if (tkActor.getGroup() != nullptr)
+	{
+		NVBLASTTK_LOG_ERROR("TkGroup::addActor: actor already belongs to a Group.  Remove from current group first.");
+		return false;
+	}
+
+	if (isProcessing())
+	{
+		NVBLASTTK_LOG_ERROR("TkGroup::addActor: cannot alter Group while processing.");
+		return false;
+	}
+
+	// mark the actor that it now belongs to this group
+	addActorInternal(tkActor);
+
+	// actors that were fractured already or have damage requested
+	// must be enqueued to be processed
+	if (tkActor.isPending())
+	{
+		enqueue(&tkActor);
+	}
+
+	TkFamilyImpl& family = tkActor.getFamilyImpl();
+	SharedMemory* mem = m_sharedMemory[&family];
+	if (mem == nullptr)
+	{
+		// the actor belongs to a family not involved in this group yet
+		// shared memory must be allocated and temporary buffers adjusted accordingly
+
+		PERF_ZONE_BEGIN("family memory");
+		mem = NVBLASTTK_NEW(SharedMemory);
+		mem->allocate(family);
+		m_sharedMemory[&family] = mem;
+		PERF_ZONE_END("family memory");
+
+		PERF_ZONE_BEGIN("group memory");
+		
+		const uint32_t numThreads = getNumThreads(m_pxTaskManager);
+		// one worker always exists, even if it is the main thread (when numThreads is 0)
+		const uint32_t numWorkers = std::max(numThreads, (uint32_t)1);
+
+		// the number of threads could have changed, however this is unexpected and handled in process()
+
+
+		NvBlastLog theLog = TkFrameworkImpl::get()->log;
+
+		// this group's tasks will use one temporary buffer each, which is of max size of, for all families involved
+		const size_t requiredScratch = NvBlastActorGetRequiredScratchForSplit(tkActor.getActorLL(), theLog);
+		if (static_cast<size_t>(m_splitScratchBlock.numElementsPerBlock()) < requiredScratch)
+		{
+			m_splitScratchBlock.release();
+			m_splitScratchBlock.allocate(static_cast<uint32_t>(requiredScratch), numWorkers);
+		}
+		
+		// generate and apply fracture may create an entry for each bond
+		const uint32_t bondCount = NvBlastAssetGetBondCount(tkActor.getAsset()->getAssetLL(), theLog);
+		if (m_bondTempDataBlock.numElementsPerBlock() < bondCount)
+		{
+			m_bondTempDataBlock.release();
+			m_bondTempDataBlock.allocate(bondCount, numWorkers);
+			m_bondEventDataBlock.release();
+			m_bondEventDataBlock.allocate(bondCount, numWorkers);
+		}
+
+		// apply fracture may create an entry for each lower-support chunk
+		const uint32_t graphNodeCount = NvBlastAssetGetSupportGraph(tkActor.getAsset()->getAssetLL(), theLog).nodeCount;
+		const uint32_t subsupportChunkCount
+			= NvBlastAssetGetChunkCount(tkActor.getAsset()->getAssetLL(), theLog)
+			- NvBlastAssetGetFirstSubsupportChunkIndex(tkActor.getAsset()->getAssetLL(), theLog);
+		const uint32_t chunkCount = graphNodeCount + subsupportChunkCount;
+		if (m_chunkTempDataBlock.numElementsPerBlock() < chunkCount)
+		{
+			m_chunkTempDataBlock.release();
+			m_chunkTempDataBlock.allocate(chunkCount, numWorkers);
+			m_chunkEventDataBlock.release();
+			m_chunkEventDataBlock.allocate(chunkCount, numWorkers);
+		}
+		PERF_ZONE_END("group memory");
+	}
+	mem->addReference();
+
+	return true;
+}
+
+
+uint32_t TkGroupImpl::getActors(TkActor** buffer, uint32_t bufferSize, uint32_t indexStart /* = 0 */) const
+{
+	PERF_SCOPE_L("TkGroup::getActors");
+
+	uint32_t actorCount = m_actorCount;
+	if (actorCount <= indexStart)
+	{
+		NVBLASTTK_LOG_WARNING("TkGroup::getActors: indexStart beyond end of actor list.");
+		return 0;
+	}
+
+	actorCount -= indexStart;
+	if (actorCount > bufferSize)
+	{
+		actorCount = bufferSize;
+	}
+
+	uint32_t index = 0;
+	bool done = false;
+	for (auto it = const_cast<TkGroupImpl*>(this)->m_sharedMemory.getIterator(); !it.done();++it)
+	{
+		TkFamilyImpl* fam = it->first;
+		for (TkActorImpl& actor : fam->getActorsInternal())
+		{
+			if (actor.m_group == this)
+			{
+				NVBLAST_ASSERT(actor.isActive());
+				
+				if (index >= indexStart)
+				{
+					*buffer++ = &actor;
+				}
+			
+				index++;
+				done = (index - indexStart) >= actorCount;
+			}
+			if (done) break;
+		}
+		if (done) break;
+	}
+
+	return actorCount;
+}
+
+
+void TkGroupImpl::removeActorInternal(TkActorImpl& tkActor)
+{
+	NVBLAST_ASSERT(tkActor.m_group == this);
+	tkActor.m_group = nullptr;
+	m_actorCount--;
+}
+
+
+void TkGroupImpl::releaseSharedMemory(TkFamilyImpl* fam, SharedMemory* mem)
+{
+	NVBLAST_ASSERT(mem != nullptr && m_sharedMemory[fam] == mem);
+	mem->release();
+	m_sharedMemory.erase(fam);
+	NVBLASTTK_DELETE(mem, SharedMemory);
+}
+
+
+bool TkGroupImpl::removeActor(TkActor& actor)
+{
+	TkActorImpl& tkActor = static_cast<TkActorImpl&>(actor);
+
+	if (tkActor.getGroup() != this)
+	{
+		NVBLASTTK_LOG_ERROR("TkGroup::removeActor: actor does not belong to this Group.");
+		return false;
+	}
+
+	if (isProcessing())
+	{
+		NVBLASTTK_LOG_ERROR("TkGroup::removeActor: cannot alter Group while processing.");
+		return false;
+	}
+
+	removeActorInternal(tkActor);
+
+	// pending actors must be removed from the job queue as well
+	if(tkActor.isPending())
+	{
+		uint32_t index = tkActor.m_groupJobIndex;
+		tkActor.m_groupJobIndex = invalidIndex<uint32_t>();
+		m_jobs.replaceWithLast(index);
+		if (index < m_jobs.size())
+		{
+			NVBLAST_ASSERT(m_jobs[index].m_tkActor->m_groupJobIndex == m_jobs.size());
+			NVBLAST_ASSERT(m_jobs[index].m_tkActor->isPending());
+			m_jobs[index].m_tkActor->m_groupJobIndex = index;
+		}
+	}
+
+	// if the actor is the last of its family in this group
+	// the group-family memory can be released
+	TkFamilyImpl* family = &tkActor.getFamilyImpl();
+	SharedMemory* mem = getSharedMemory(family);
+	if (mem->removeReference())
+	{
+		releaseSharedMemory(family, mem);
+	}
+
+	return true;
+}
+
+
+TkGroupImpl* TkGroupImpl::create(const TkGroupDesc& desc)
+{
+	if (desc.pxTaskManager == nullptr)
+	{
+		NVBLASTTK_LOG_WARNING("TkGroup::create: attempting to create a Group with a NULL pxTaskManager.");
+	}
+
+	TkGroupImpl* group = NVBLASTTK_NEW(TkGroupImpl);
+
+	group->m_pxTaskManager = desc.pxTaskManager;
+	group->m_initialNumThreads = getNumThreads(group->m_pxTaskManager);
+
+	return group;
+}
+
+
+bool TkGroupImpl::process()
+{
+	PERF_SCOPE_L("TkGroup::process");
+
+	if (!setProcessing(true))
+	{
+		NVBLASTTK_LOG_WARNING("TkGroup::process: Group is still processing, call TkGroup::sync first.");
+		return false;
+	}
+
+	if (m_jobs.size() > 0)
+	{
+		PERF_ZONE_BEGIN("task setup");
+
+		PERF_ZONE_BEGIN("task memory");
+		const uint32_t numThreads = getNumThreads(m_pxTaskManager);
+		// one worker always exists, even if it is the main thread (when numThreads is 0)
+		const uint32_t numWorkers = std::max(numThreads, (uint32_t)1);
+
+		if (numThreads != m_initialNumThreads)
+		{
+			NVBLASTTK_LOG_WARNING("TkGroup::process: number of threads has changed, memory is being reallocated.");
+			m_initialNumThreads = numThreads;
+
+			const uint32_t bondCount = m_bondTempDataBlock.numElementsPerBlock();
+			if (bondCount > 0)
+			{
+				m_bondTempDataBlock.release();
+				m_bondTempDataBlock.allocate(bondCount, numWorkers);
+				m_bondEventDataBlock.release();
+				m_bondEventDataBlock.allocate(bondCount, numWorkers);
+			}
+			const uint32_t chunkCount = m_chunkTempDataBlock.numElementsPerBlock();
+			m_chunkTempDataBlock.release();
+			m_chunkTempDataBlock.allocate(chunkCount, numWorkers);
+			m_chunkEventDataBlock.release();
+			m_chunkEventDataBlock.allocate(chunkCount, numWorkers);
+			const uint32_t scratchSize = m_splitScratchBlock.numElementsPerBlock();
+			m_splitScratchBlock.release();
+			m_splitScratchBlock.allocate(scratchSize, numWorkers);
+		}
+		PERF_ZONE_END("task memory");
+
+
+		PERF_ZONE_BEGIN("setup job queue");
+		for (const auto& job : m_jobs)
+		{
+			const TkActorImpl* a = job.m_tkActor;
+			SharedMemory* mem = getSharedMemory(&a->getFamilyImpl());
+
+			const uint32_t damageCount = a->m_damageBuffer.size();
+
+			// applyFracture'd actor do not necessarily have damage queued
+			NVBLAST_ASSERT(damageCount > 0 || a->m_flags.isSet(TkActorFlag::DAMAGED));
+
+			// no reason to be here without these
+			NVBLAST_ASSERT(a->m_flags.isSet(TkActorFlag::PENDING));
+			NVBLAST_ASSERT(a->m_group == this);
+
+			// collect the amount of event payload memory to preallocate for TkWorkers
+			mem->m_eventsMemory += damageCount * (sizeof(TkFractureCommands) + sizeof(TkFractureEvents)) + sizeof(TkSplitEvent);
+
+			// collect the amount of event entries to preallocate for TkWorkers
+			// (two TkFracture* events per damage plus one TkSplitEvent)
+			mem->m_eventsCount += 2 * damageCount + 1;
+		}
+		PERF_ZONE_END("setup job queue");
+
+		PERF_ZONE_BEGIN("memory protect");
+		for (auto it = m_sharedMemory.getIterator(); !it.done(); ++it)
+		{
+			// preallocate the event memory for TkWorkers
+			SharedMemory* mem = it->second;
+			mem->m_events.reserveData(mem->m_eventsMemory);
+			mem->m_events.reserveEvents(mem->m_eventsCount);
+
+			// these counters are not used anymore
+			// reset them immediately for next time
+			mem->m_eventsCount = 0;
+			mem->m_eventsMemory = 0;
+
+			// switch to parallel mode
+			mem->m_events.protect(true);
+		}
+		PERF_ZONE_END("memory protect");
+
+		PERF_ZONE_END("task setup");
+
+		// ready queue for the workers
+		const uint32_t numJobs = m_jobs.size();
+		m_jobQueue.init(m_jobs.begin(), numJobs);
+
+		// do not start more workers than there are jobs
+		const uint32_t workersToRun = std::min(numWorkers, numJobs);
+		m_workers.resize(workersToRun);
+		m_sync.setCount(workersToRun);
+
+		uint32_t workerId = 0;
+		if (numThreads > 0)
+		{
+			for (auto& task : m_workers)
+			{
+				PERF_SCOPE_M("task release");
+				task.m_id = workerId++;
+				task.m_group = this;
+				task.setContinuation(*m_pxTaskManager, nullptr);
+				// mind m_sync.setCount above, immediately removing reference would not work with a continuation task
+				task.removeReference();
+			}
+		}
+		else
+		{
+			// let this thread do the work
+			NVBLAST_ASSERT(m_workers.size() == 1);
+			for (auto& task : m_workers)
+			{
+				task.m_id = workerId++;
+				task.m_group = this;
+				task.run();
+				task.release();
+			}
+		}
+	}
+
+
+	return true;
+}
+
+
+bool TkGroupImpl::sync(bool block /*= true*/)
+{
+	if (!m_sync.isDone() && block)
+	{
+		PERF_SCOPE_L("TkGroupImpl::sync wait");
+		m_sync.wait();
+	}
+
+	if (isProcessing() && m_sync.isDone())
+	{
+		PERF_SCOPE_L("TkGroupImpl::sync finalize");
+
+		if (m_jobs.size() > 0)
+		{
+#if NV_PROFILE
+			PERF_ZONE_BEGIN("accumulate timers");
+			NvBlastTimers accumulated;
+			NvBlastTimersReset(&accumulated);
+			uint32_t jobCount = 0;
+			int64_t workerTime = 0;
+			for (TkWorker& worker : m_workers)
+			{
+				accumulated += worker.m_stats.timers;
+				jobCount += worker.m_stats.processedActorsCount;
+				workerTime += worker.m_stats.workerTime;
+			}
+			m_stats.timers = accumulated;
+			m_stats.processedActorsCount = jobCount;
+			m_stats.workerTime = workerTime;
+			PERF_ZONE_END("accumulate timers");
+#endif
+
+			PERF_ZONE_BEGIN("job update");
+			for (auto& j : m_jobs)
+			{
+				if (j.m_newActorsCount)
+				{
+					TkFamilyImpl* fam = &j.m_tkActor->getFamilyImpl();
+					SharedMemory* mem = getSharedMemory(fam);
+
+					// as LL is implemented, where newActorsCount the parent is always deleted
+					removeActorInternal(*j.m_tkActor);
+					mem->removeReference();
+					addActorsInternal(j.m_newActors, j.m_newActorsCount);
+					mem->addReference(j.m_newActorsCount);
+					
+					// Update joints
+					mem->m_events.protect(false); // allow allocations again
+					fam->updateJoints(j.m_tkActor, &mem->m_events);
+				}
+
+				// virtually dequeue the actor
+				// the queue itself is cleared right after this loop
+				j.m_tkActor->m_flags.clear(TkActorFlag::PENDING);
+				j.m_tkActor->m_groupJobIndex = invalidIndex<uint32_t>();
+				j.m_tkActor->m_damageBuffer.clear();
+			}
+			m_jobs.clear();
+			PERF_ZONE_END("job update");
+
+			PERF_ZONE_BEGIN("event dispatch");
+			for (auto it = m_sharedMemory.getIterator(); !it.done(); ++it)
+			{
+				TkFamilyImpl* family = it->first;
+				SharedMemory* mem = it->second;
+
+				NVBLAST_ASSERT(family != nullptr);
+				NVBLAST_ASSERT(mem != nullptr && mem->isUsed());
+
+				// where no actor of a family has split, 
+				// its group/family event queue has not been 
+				// unprotected in the jobs loop above
+				mem->m_events.protect(false);
+
+				family->getQueue().dispatch(mem->m_events);
+
+				mem->m_events.reset();
+				mem->reset();
+			}
+			PERF_ZONE_END("event dispatch");
+
+			PERF_ZONE_BEGIN("event memory release");
+			for (auto& worker : m_workers)
+			{
+				worker.m_bondBuffer.clear();
+				worker.m_chunkBuffer.clear();
+			}
+			PERF_ZONE_END("event memory release");
+		}
+
+		bool success = setProcessing(false);
+		NVBLAST_ASSERT(success);
+		return success;
+	}
+
+	return false;
+}
+
+
+bool TkGroupImpl::setProcessing(bool value)
+{
+	bool expected = !value;
+	return m_isProcessing.compare_exchange_strong(expected, value);
+}
+
+
+void TkGroupImpl::enqueue(TkActorImpl* tkActor)
+{
+	NVBLAST_ASSERT(tkActor->getGroupImpl() != nullptr);
+	NVBLAST_ASSERT(tkActor->getGroupImpl() == this);
+	NVBLAST_ASSERT(isInvalidIndex(tkActor->m_groupJobIndex));
+	NVBLAST_ASSERT(isProcessing() == false);
+#if NV_DEBUG
+	for (TkWorkerJob& j : m_jobs)
+	{
+		NVBLAST_ASSERT(j.m_tkActor != tkActor);
+	}
+#endif
+
+	tkActor->m_groupJobIndex = m_jobs.size();
+	TkWorkerJob& j = m_jobs.insert();
+	j.m_tkActor = tkActor;
+}
+
+
+} // namespace Blast
+} // namespace Nv