21 哲学家就餐问题：什么情况下会触发饥饿和死锁？

这一讲给你带来的面试题目是：什么情况下会触发饥饿和死锁？

读题可知，这道题目在提问“场景”，从表面来看，解题思路是列举几个例子。但是在回答这类面试题前你一定要想一想面试官在考察什么，往往在题目中看到“什么情况下”时，其实考察的是你总结和概括信息的能力。

关于上面这道题目，如果你只回答一个场景，而没有输出概括性的总结内容，就很容易被面试官认为对知识理解不到位，因而挂掉面试。另外，提问死锁和饥饿还有一个更深层的意思，就是考察你在实战中对并发控制算法的理解，是否具备设计并发算法来解决死锁问题并且兼顾性能（并发量）的思维和能力。

要学习这部分知识有一个非常不错的模型，就是哲学家就餐问题。1965 年，计算机科学家 Dijkstra 为了帮助学生更好地学习并发编程设计的一道练习题，后来逐渐成为大家广泛讨论的问题。

哲学家就餐问题

问题描述如下：有 5 个哲学家，围着一个圆桌就餐。圆桌上有 5 份意大利面和 5 份叉子。哲学家比较笨，他们必须拿到左手和右手的 2 个叉子才能吃面。哲学不饿的时候就在思考，饿了就去吃面，吃面的必须前提是拿到 2 个叉子，吃完面哲学家就去思考。

Drawing 0.png

假设每个哲学家用一个线程实现，求一种并发控制的算法，让哲学家们按部就班地思考和吃面。当然我这里做了一些改动，比如 Dijkstra 那个年代线程还没有普及，最早的题目每个哲学家是一个进程。

问题的抽象

接下来请你继续思考，我们对问题进行一些抽象，比如哲学是一个数组，编号 0~4。我这里用 Java 语言给你演示，哲学家是一个类，代码如下：

static class Philosopher implements Runnable {



    private static Philosopher[] philosophers;



    static {



       philosophers = new Philosopher[5];



    }



}

这里考虑叉子也使用编号 0~4，代码如下：

private static Integer[] forks;



private static Philosopher[] philosophers;



static {



   for(int i = 0; i < 5; i++) {



        philosophers[i] = new Philosopher(i);



        forks[i] = -1;



    }



}

forks[i]的值等于 x，相当于编号为i的叉子被编号为 x 的哲学家拿起；如果等于-1，那么叉子目前放在桌子上。

我们经常需要描述左、右的关系，为了方便计算，可以设计 1 个帮助函数（helper functions），帮助我们根据一个编号，计算它左边的编号。

 private static int LEFT(int i) {



      return i == 0 ? 4 : i-1;



}

假设和哲学家编号一致的叉子在右边，这样如果要判断编号为id哲学家是否可以吃面，需要这样做：

if(forks[LEFT(id)] == id && forks[id] == id) {



  // 可以吃面



}

然后定义一个_take函数拿起编号为i叉子; 再设计一个_put方法放下叉子：

void _take(int i) throws InterruptedException {



    Thread.sleep(10);



    forks[i] = id;



}



void _put(int i){



  if(forks[i] == id)



    forks[i] = -1;



}

_take函数之所以会等待 10ms，是因为哲学家就餐问题的实际意义，是 I/O 处理的场景，拿起叉子好比读取磁盘，需要有一等的时间开销，这样思考才有意义。

然后是对think和eat两个方法的抽象。首先我封装了一个枚举类型，描述哲学家的状态，代码如下：

enum PHIS {



    THINKING,



    HUNGRY,



    EATING



}

然后实现think方法，think方法不需要并发控制，但是这里用Thread.sleep模拟实际思考需要的开销，代码如下：

void think() throws InterruptedException {



            System.out.println(String.format("Philosopher %d thinking...", id));



            Thread.sleep((long) Math.floor(Math.random()*1000));



            this.state = PHIS.HUNGRY;

最后是eat方法：

void eat() throws InterruptedException {



  synchronized (forks) {



      if(forks[LEFT(id)] == id && forks[id] == id) {



          this.state = PHIS.EATING;



      } else {



          return;



      }



  }



  Thread.sleep((long) Math.floor(Math.random()*1000));

}

eat方法依赖于forks对象的锁，相当于eat方法这里会同步——因为这里有读取临界区操作做。Thread.sleep依然用于描述eat方法的时间开销。sleep方法没有放到synchronized内是因为在并发控制时，应该尽量较少锁的范围，这样可以增加更大的并发量。

以上，我们对问题进行了一个基本的抽象。接下来请你思考在什么情况会发生死锁？

死锁（DeadLock）和活锁（LiveLock）

首先，可以思考一种最简单的解法，每个哲学家用一个while循环表示，代码如下：

while(true){



  think();



  _take(LEFT(id)); 



  _take(id);



  eat();



  _put(LEFT(id));



  _put(id); 



}



void _take(id){



  while(forks[id] != -1) {  Thread.yield();  }



  Thread.sleep(10); // 模拟I/O用时



}

_take可以考虑阻塞，直到哲学家得到叉子。上面程序我们还没有进行并发控制，会发生竞争条件。顺着这个思路，就可以想到加入并发控制，代码如下：

while(true){



  think();



  synchronized(fork[LEFT(id)]) {



    _take(LEFT(id)); 



    synchronized(fork[id]) {



      _take(id);



    }



  }



  eat();



  synchronized(fork[LEFT(id)]) {



    _put(LEFT(id));



    synchronized(fork[id]) {



      _put(id); 



    }



  }



}

上面的并发控制，会发生死锁问题，大家可以思考这样一个时序，如果 5 个哲学家都同时通过synchronized(fork[LEFT(id)])，有可能会出现下面的情况：

第 0 个哲学家获得叉子 4，接下来请求叉子 0；
第 1 个哲学家获得叉子 0，接下来请求叉子 1；
第 2 个哲学家获得叉子 1，接下来请求叉子 2；
第 3 个哲学家获得叉子 2，接下来请求叉子 3；
第 4 个哲学家获得叉子 3，接下来请求叉子 4。

为了帮助你理解，这里我画了一幅图。

如上图所示，可以看到这是一种循环依赖的关系，在这种情况下所有哲学家都获得了一个叉子，并且在等待下一个叉子。这种等待永远不会结束，因为没有哲学家愿意放弃自己拿起的叉子。

以上这种情况称为**死锁（Deadlock），这是一种饥饿（Starvation）**的形式。从概念上说，死锁是线程间互相等待资源，但是没有一个线程可以进行下一步操作。饥饿就是因为某种原因导致线程得不到需要的资源，无法继续工作。死锁是饥饿的一种形式，因为循环等待无法得到资源。哲学家就餐问题，会形成一种环状的死锁（循环依赖），因此非常具有代表性。

死锁有 4 个基本条件。

资源存在互斥逻辑：每次只有一个线程可以抢占到资源。这里是哲学家抢占叉子。
持有等待：这里哲学家会一直等待拿到叉子。
禁止抢占：如果拿不到资源一直会处于等待状态，而不会释放已经拥有的资源。
循环等待：这里哲学家们会循环等待彼此的叉子。

刚才提到死锁也是一种饥饿（Starvation）的形式，饥饿比较简单，就是线程长期拿不到需要的资源，无法进行下一步操作。

要解决死锁的问题，可以考虑哲学家拿起 1 个叉子后，如果迟迟没有等到下一个叉子，就放弃这次操作。比如 Java 的 Lock Interface 中，提供的tryLock方法，就可以实现定时获取：

var lock = new ReentrantLock();



lock.tryLock(5, TimeUnit.SECONDS);

Java 提供的这个能力是拿不到锁，就报异常，并可以依据这个能力开发释放已获得资源的能力。

但是这样，我们会碰到一个叫作活锁（LiveLock）的问题。LiveLock 也是一种饥饿。可能在某个时刻，所有哲学及都拿起了左手的叉子，然后发现右手的叉子拿不到，就放下了左手的叉子——如此周而复始，这就是一种活锁。所有线程都在工作，但是没有线程能够进一步——解决问题。

在实际工作场景下，LiveLock 可以靠概率解决，因为同时拿起，又同时放下这种情况不会很多。实际工作场景很多系统，确实依赖于这个问题不频发。但是，优秀的设计者不能把系统设计依托在一个有概率风险的操作上，因此我们需要继续往深一层思考。

解决方案

其实解决上述问题有很多的方案，最简单、最直观的方法如下：

while(true){



    synchronized(someLock) {



      think();



      _take(LEFT(id)); 



      _take(id);



      eat();



      _put(LEFT(id));



      _put(id); 



    }



}

上面这段程序同时只允许一个哲学家使用所有资源，我们用synchronized构造了一种排队的逻辑。而哲学家，每次必须拿起所有的叉子，吃完，再到下一哲学家。这样并发度是 1，同时最多有一个线程在执行。这样的方式可以完成任务，但是性能太差。

另一种方法是规定拿起过程必须同时拿起，放下过程也同时放下，代码如下：

while(true){



    think();



    synchronized(someLock) {



      _takeForks(); 



    }



    eat();



    synchronized(someLock) {



      _puts();



    }



}



void _takeForks(){



  if( forks[LEFT(id)] == -1 && forks[id] == -1 ) {



    forks[LEFT(id)] = id;



    forks[id] = id;



  }



}



void _puts(){



    if(forks[LEFT(id)] == id)



      forks[LEFT(id)] = -1;



    if(forks[id] == id)



      forks[id] = -1;



}

上面这段程序，think函数没有并发控制，一个哲学家要么拿起两个叉子，要么不拿起，这样并发度最高为 2（最多有两个线程同时执行）。而且，这个算法中只有一个锁，因此不存在死锁和饥饿问题。

到这里，我们已经对这个问题有了一个初步的方案，那么如何进一步优化呢？

思考和最终方案

整个问题复杂度的核心在于哲学家拿起叉子是有成本的。好比线程读取磁盘，需要消耗时间。哲学家的思考，是独立的。好比读取了磁盘数据，进行计算。那么有没有办法允许 5 个哲学家都同时去拿叉子呢？这样并发度是最高的。

经过初步思考，马上会发现这里有环状依赖，会出现死锁。原因就是如果 5 个哲学家同时拿叉子，那就意味着有的哲学家必须要放弃叉子。但是如果不放下会出现什么情况呢？

假设当一个哲学家发现自己拿不到两个叉子的时候，他去和另一个哲学家沟通把自己的叉子给对方。这样就相当于，有一个转让方法。相比于磁盘 I/O，转让内存中的数据成本就低的多了。我们假设有这样一个转让的方法，代码如下：

void _transfer(int fork, int philosopher) {



     forks[fork] = philosopher;



     dirty[fork] = false;



}

这个方法相当于把叉子转让给另一个哲学家，这里你先不用管上面代码中的 dirty，后文中会讲到。而获取叉子的过程，我们可以进行调整，代码如下：

void take(int i) throws InterruptedException {



      synchronized (forks[i]) {



          if(forks[i] == -1) {



              _take(id); 



          } else {



              Philosopher other = philosophers[forks[i]];



              if(other.state != PHIS.EATING && dirty[i]) {



                  other._transfer(i, forks[i]);



              }



          }



      }



  }



void _take(int i) throws InterruptedException {



    Thread.sleep(10);



    forks[i] = id;



}

这里我们把每个叉子看作一个锁，有多少个叉子，就有多少个锁，相当于同时可以拿起 5 个叉子（并发度是 5）。如果当前没有人拿起叉子，那么可以自己拿起。如果叉子属于其他哲学家，就需要判断对方的状态。只要对方不在EATING，就可以考虑转让叉子。

最后是对 LiveLock 的思考，为了避免叉子在两个哲学家之间来回转让，我们为每个叉子增加了一个dirty属性。一开始叉子的dirty是true，每次转让后，哲学家会把自己的叉子擦干净给另一个哲学家。转让的前置条件是叉子是dirty的，所以叉子在两个哲学家之间只会转让一次。

通过上面算法，我们就可以避免死锁、饥饿以及提高读取数据（获取叉子）的并发度。最后完整的程序如下，给你做参考：

package test;



import java.util.Arrays;



import java.util.concurrent.ExecutorService;



import java.util.concurrent.Executors;



import java.util.concurrent.ThreadPoolExecutor;



import java.util.concurrent.TimeUnit;



import java.util.concurrent.atomic.AtomicInteger;



import java.util.concurrent.locks.ReentrantLock;



import java.util.concurrent.locks.StampedLock;



public class DiningPhilosophers {



    enum PHIS {



        THINKING,



        HUNGRY,



        EATING



    }



    static class Philosopher implements Runnable {



        private static Philosopher[] philosophers;



        private static Integer[] forks;



        private static boolean[] dirty;



        private PHIS state = PHIS.THINKING;



        static {



            philosophers = new Philosopher[5];



            forks = new Integer[5];



            dirty = new boolean[5];



            for(int i = 0; i < 5; i++) {



                philosophers[i] = new Philosopher(i);



                forks[i] = -1;



                dirty[i] = true;



            }



        }



        private static int LEFT(int i) {



            return i == 0 ? 4 : i-1;



        }



        public Philosopher(int id) {



            this.id = id;



        }



        private int id;



        void think() throws InterruptedException {



            System.out.println(String.format("Philosopher %d thinking...", id));



            Thread.sleep((long) Math.floor(Math.random()*1000));



            this.state = PHIS.HUNGRY;



        }



             System.out.println(Arrays.toString(forks));



                    //System.out.println(Arrays.toString(dirty));



                    if(forks[LEFT(id)] == id && forks[id] == id) {



                        this.state = PHIS.EATING;



                    } else {



                        return;



                    }



            }



            System.out.println(String.format("Philosopher %d eating...", id));



            Thread.sleep((long) Math.floor(Math.random()*1000));



            synchronized (forks) {



                dirty[LEFT(id)] = true;



                dirty[id] = true;



            }



            var lock = new ReentrantLock();



            lock.tryLock(5, TimeUnit.SECONDS);



            state = PHIS.THINKING;



        }



        void _take(int i) throws InterruptedException {



            Thread.sleep(10);



            forks[i] = id;



        }



        void _transfer(int fork, int philosopher) {



            forks[fork] = philosopher;



            dirty[fork] = false;



        }



        void _putdown(int i) throws InterruptedException {



            Thread.sleep(10);



            forks[i] = -1;



        }



        void take(int i) throws InterruptedException {



            synchronized (forks[i]) {



                if(forks[i] == -1) {



                    _take(id);



                } else {



                    Philosopher other = philosophers[forks[i]];



                    if(other.state != PHIS.EATING && dirty[i]) {



                        other._transfer(i, forks[i]);



                    }



                }



            }



        }



        void takeForks() throws InterruptedException {



            take(LEFT(id));



            take(id);



        }



        @Override



        public void run() {



            try {



                while(true) {



                    think();



                    while (state == PHIS.HUNGRY) {



                        takeForks();



                        System.out.println("here--" + Math.random());



                        eat();



                    }



                }



            } catch (InterruptedException e) {



                e.printStackTrace();



            }



        }



    }



    public static void main(String[] args) {



        for(int i = 0; i < 5; i++) {



            new Thread(new Philosopher(i)).start();



        }



    }



}

总结

那么通过这节课的学习，你现在可以尝试来回答本节关联的面试题目：什么情况下会触发饥饿和死锁？

【解析】 线程需要资源没有拿到，无法进行下一步，就是饥饿。死锁（Deadlock）和活锁（Livelock）都是饥饿的一种形式。非抢占的系统中，互斥的资源获取，形成循环依赖就会产生死锁。死锁发生后，如果利用抢占解决，导致资源频繁被转让，有一定概率触发活锁。死锁、活锁，都可以通过设计并发控制算法解决，比如哲学家就餐问题。

关于

极客时间

拉勾教育

GitChat

掘金小册

其它