項目背景

現(xiàn)實困境

做C、C++開發(fā)的朋友應該都知道，C、C++中的內(nèi)存是手動管理的，手動內(nèi)存管理是一把雙刃劍，雖然提供了極致性能，但可能由于開發(fā)者的一點點疏忽，就導致內(nèi)存泄露。據(jù)非官方統(tǒng)計，全球每年因內(nèi)存泄露導致的系統(tǒng)崩潰事故超過120萬次。

C、C++開發(fā)者面臨以下痛點時經(jīng)常束手無策：

幽靈式內(nèi)存泄露：程序運行數(shù)天后，出現(xiàn)內(nèi)存耗盡，因為程序是一點點釋放的，不太容易發(fā)現(xiàn)具體問題所在。
多線程競態(tài)問題：死鎖導致的服務假死，并且不好復現(xiàn)。

現(xiàn)有方案的局限

傳統(tǒng)工具，Asan、valgrind、gdb功能非常強大，可以檢測基本的問題，但也恰恰是因為功能太過豐富且強大，所以性能損耗非常高，無法用于線上環(huán)境，并且難以捕獲隨機出現(xiàn)的死鎖場景。

項目目標

開發(fā)一個零侵入、高性能、全維度的運行時診斷系統(tǒng)：

內(nèi)存監(jiān)控：可以實時追蹤每個內(nèi)存塊的完整生命周期。
死鎖檢測：可以檢測出死鎖，并能檢測出哪個線程的哪幾把鎖出現(xiàn)了死鎖，哪個線程由于等待的哪把鎖而出現(xiàn)的死鎖，可以精確關(guān)聯(lián)源代碼位置。
內(nèi)存泄露檢測：可以檢測出具體哪塊內(nèi)存出現(xiàn)了泄露，并精確關(guān)聯(lián)到源代碼位置。

項目介紹

整體架構(gòu)如圖：

內(nèi)存檢測

直接看代碼，下面代碼會發(fā)生內(nèi)存泄露：

extern "C"int TestMemoryLeak() {  int *ptr = (int *)malloc(100);  printf("TestMemoryLeak: %p\n", ptr);  free(ptr);  return 0; }  extern"C"int TestMemoryLeak2() {  int *ptr = (int *)malloc(110);  printf("TestMemoryLeak2: %p\n", ptr);  int *p = newint[10];   auto q = std::make_unique<int>(10);  return 0; }

集成了工具后：

int main() {  OpenDynamicExample();  MemoryDetector detect("/mnt/d/project/camping/detector/libdynamic_example.so");   detect.StartTracking();   UseDynamicExample();   detect.StopTracking(); // 會打印 lib1.so 的內(nèi)存使用情況  CloseDynamicExample();   return 0; }

直接就可以檢測這個動態(tài)庫的內(nèi)存情況：

本工具可以檢測出程序申請了多少內(nèi)存，申請了多少塊內(nèi)存，以及具體哪里發(fā)生了內(nèi)存泄露，可以精確到具體的源代碼位置。

它不僅可以檢測malloc、free申請和釋放的內(nèi)存，即便是C++的new、delete、new[]、delete[]、std::make_unique、std::make_shared，也可以，不管程序是通過哪種方式申請和釋放的內(nèi)存，只要發(fā)生了內(nèi)存泄露，工具都可以檢測到。

整體采用Hook方案，基本流程如圖：

死鎖檢測

看這段發(fā)生死鎖的代碼：

static void *ThreadFunc1(void *) {  pthread_mutex_lock(&mutexA);  std::cout << "Thread 1: Locked A\n";  sleep(1);   std::cout << "Thread 1: Trying to lock B\n";  pthread_mutex_lock(&mutexB);  std::cout << "Thread 1: Locked B\n";   pthread_mutex_unlock(&mutexB);  pthread_mutex_unlock(&mutexA);  return nullptr; }  static void *ThreadFunc2(void *) {  pthread_mutex_lock(&mutexB);  std::cout << "Thread 2: Locked B\n";  sleep(1);   std::cout << "Thread 2: Trying to lock A\n";  pthread_mutex_lock(&mutexA);  std::cout << "Thread 2: Locked A\n";   pthread_mutex_unlock(&mutexA);  pthread_mutex_unlock(&mutexB);  return nullptr; }  static void *ThreadFunc3(void *) {  std::mutex mtx;  std::cout << "Thread 3: Trying to lock mutex\n";  mtx.lock();  std::cout << "Thread 3: Locked mutex\n";  sleep(1);  mtx.unlock();  return nullptr; }  // 導出的函數(shù)，用于創(chuàng)建死鎖場景 static void CreateDeadlock() {  pthread_t t1, t2, t3;  pthread_attr_t attr;   // 初始化線程屬性  pthread_attr_init(&attr);  pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);   // 創(chuàng)建分離的線程  pthread_create(&t1, &attr, ThreadFunc1, nullptr);  pthread_create(&t2, &attr, ThreadFunc2, nullptr);  pthread_create(&t3, &attr, ThreadFunc3, nullptr);   // 銷毀線程屬性  pthread_attr_destroy(&attr);   // 等待一段時間讓死鎖發(fā)生  sleep(3); }

從代碼中可以看到，Thread1和Thread2會發(fā)生死鎖，集成工具后：

LockHook lock_hook("./libdynamic_example.so"); if (!lock_hook.StartTracking()) {  std::cerr << "Failed to start lock tracking\n";  dlclose(handle);  return 1; } lock_hook.StopTracking();