Linux驱动模型详解

让所有很久很久以前都走到幸福结局的时刻

1.Linux 驱动模型

本节内容，重在理解。面试时，面试官很大可能会让你挑一个你熟悉的驱动讲讲，如何编写的？能回答出大概的驱动框架就可以。

1.1 字符设备驱动模型

驱动初始化中涉及到一个设备描述结构的概念。在任何一种驱动模型中，设备都会用内核中的一种结构来描述，这种结构成为设备描述结构。字符设备在内核中使用struct cdev这种结构来描述。

struct cdev 
{
    struct kobject kobj;
    struct module *owner;
    const struct file_operations *ops; //设备操作集
    struct list_head list;
    dev_t dev; //设备号
    unsigned int count; //设备数
};

count表明该类型设备的数目，如有两个串口，则count的值为2。
dev是设备号，包含有主设备号和次设备号的信息。主设备号用于区分设备的类型，次设备号用于标记相同类型的设备的不同个体。如串口1和串口2使用同一驱动程序，则其主设备号相同，但次设备号不同。Linux内核中使用dev_t类型来定义设备号，dev_t这种类型其实质为32位的unsigned int，其中高12位为主设备号，低20位为次设备号。
1. 知道主设备号与次设备号，可通过dev_t dev = MKDEV(主设备号，次设备号) 获得设备号；
2. 从设备号分解出主设备号：主设备号 = MAJOR(dev_t dev)
3. 从设备号分解出次设备号：次设备号 = MINOR(dev_t dev)
主设备号是一个重要的资源，可以通过静态申请和动态分配为设备分配一个主设备号：
1. 静态申请：开发者自己选择一个数字作为主设备号，然后通过函数register_chrdev_region向内核申请使用。这种方法的缺点是如果申请使用的设备号已经被内核中的其它驱动使用了，则申请失败。
2. 动态分配：使用alloc_chrdev_region由内核分配一个可用的主设备号。因为内核知道哪些号已经被使用了，所以不会导致分配到已经被使用的号。既然设备号是一种资源，则设备驱动在退出后都应该释放该资源。使用unregister_chrdev_region函数释放这些设备号。
ops是操作函数集。file_operations是一个很重要的结构，该结构的成员基本都是函数指针，并且是一些文件操作的函数的指针。

struct file_operations {
  struct module *owner;
  loff_t(*llseek) (struct file *, loff_t, int);
  ssize_t(*read) (struct file *, char __user *, size_t, loff_t *);
  ssize_t(*aio_read) (struct kiocb *, char __user *, size_t, loff_t);
  ssize_t(*write) (struct file *, const char __user *, size_t, loff_t *);
  ssize_t(*aio_write) (struct kiocb *, const char __user *, size_t, loff_t);
  int (*readdir) (struct file *, void *, filldir_t);
  unsigned int (*poll) (struct file *, struct poll_table_struct *);
  int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long);
  int (*mmap) (struct file *, struct vm_area_struct *);
  int (*open) (struct inode *, struct file *);
  int (*flush) (struct file *);
  int (*release) (struct inode *, struct file *);
  int (*fsync) (struct file *, struct dentry *, int datasync);
  int (*aio_fsync) (struct kiocb *, int datasync);
  int (*fasync) (int, struct file *, int);
  int (*lock) (struct file *, int, struct file_lock *);
  ssize_t(*readv) (struct file *, const struct iovec *, unsigned long, 
loff_t *);
  ssize_t(*writev) (struct file *, const struct iovec *, unsigned long, 
loff_t *);
  ssize_t(*sendfile) (struct file *, loff_t *, size_t, read_actor_t, void 
__user *);
  ssize_t(*sendpage) (struct file *, struct page *, int, size_t, loff_t *, 
int);
  unsigned long (*get_unmapped_area) (struct file *, unsigned long,unsigned 
long, unsigned long,unsigned long);
};    
1
2
3
4
5
6
7
8
9
10
11
12

`struct file_operations`是一个函数指针的集合，定义能在设备上进行的操作。结构中的函数指针指向驱动中的函数，这些函数实现一个针对设备的操作, 对于不支持的操作则设置函数指针为 NULL。例如：

```c
struct file_operations dev_fops = {
    .llseek = NULL,
    .read = dev_read,
    .write = dev_write,
    .ioctl = dev_ioctl,
    .open = dev_open,
    .release = dev_release,
};


- 该结构体表示应用程序能够对设备文件使用函数`read()`, `write()`等，但不能使用函数`llseek()`。当执行到`read()`函数时，内核根据该结构体转移到驱动程序中的`dev_read`函数去执行。

- 驱动初始化有四大步骤：

  1.**分配**

  - cdev变量的定义可以采用静态和动态两种办法：
  - 静态分配：`struct cdev mdev`；
  - 动态分配：`struct cdev *pdev = cdev_alloc()`；

  2.**初始化**

  - `struct cdev`的初始化使用`cdev_init`函数来完成。
  - 原型：`cdev_init(struct cdev *cdev, const struct file_operations *fops)`
  - 参数：
    - `cdev`：待初始化的cdev结构
    - `fops`：设备对应的操作函数集

  3.注册

  - 字符设备的注册使用`cdev_add`函数来完成。
  - 原型：`cdev_add(struct cdev *p, dev_t dev, unsigned count)`
  - 参数：
    - `p`：待添加到内核的字符设备结构
    - `dev`：设备号
    - `count`：该类设备的设备个数

  4.**硬件初始化**

  - 根据相应硬件的数据手册完成初始化。

1.2 实现设备操作

由struct file_operations可以看出，要实现的操作并不少，这里只介绍一些重要的操作。

int (*open)(struct inode *, struct file *) //打开设备，响应open系统调用
int (*release)(struct inode *, struct file *);//关闭设备，响应close系统调用
loff_t (*llseek)(struct file *, loff_t, int) //重定位读写指针，响应lseek系统调用
ssize_t (*read)(struct file *, char __user *, size_t, loff_t *) //从设备读取数据，响应read系统调用
ssize_t (*write)(struct file *, const char __user *, size_t, loff_t *) //向设备写入数据，响应write系统调用

以上几个函数涉及到了struct inode和struct file这两种结构体。
在Linux系统中，每一个打开的文件，在内核中都会关联一个struct file结构体，它由内核在打开文件时创建，在文件关闭后释放。该结构体的重要成员有：

loff_t f_pos /*文件读写指针*/
struct file_operations *f_op /*该文件所对应的操作*/
1
2
3
4
5

每一个存在于文件系统里面的文件都会关联一个`inode` 结构，该结构主要用来**记录文件物理上的信息**。因此，它和代表打开文件的file结构是不同的。一个文件**没有被打开时不会关联file结构，但是却会关联一个inode结构**。该结构体重要的成员有：

```c
dev_t i_rdev /*设备号*/


- 一个设备支持的函数操作又称为设备方法。

- `open`设备方法是驱动程序用来为以后的操作完成**初始化**准备工作的。在大部分驱动程序中，open完成如下工作：**标明次设备号、启动设备**。

- `release`设备方法的作用与open相反，这个设备方法有时也称为close，它完成的工作是**关闭设备**。

- `read`设备方法通常完成两件事情：从设备中**读取数据**(属于硬件访问类操作)，将读取到的数据**返回给应用程序**。

- ```c
  ssize_t (*read)(struct file *filp,char __user *buff,size_t count,loff_t *offp)
  1
2
3
4
5
6
7
8
9
10
11
12
13

- 参数说明：

  1. `filp`：与字符设备文件关联的file结构指针，由内核创建。
  2. `buff`：从设备读取到的数据，需要**保存到的位置**。由read系统调用提供该参数。
  3. `count`：请求传输的**数据量**，由read系统调用提供该参数。
  4. `offp`：文件的**读写位置**，由内核从file结构中取出后(相当于读取指针)，传递进来。

- 要注意的是，`buff`参数是来源于用户空间的指针，这类指针都**不能被内核代码直接引用**，必须使用专门的函数：

- ```c
  int copy_to_user(void __user *to, const void *from, int n)	// 内核态->用户态
  int copy_from_user(void *to, const void __user *from, int n)	// 用户态->内核态


    - 其中`copy_to_user()`用于将内核数据传送给用户空间；`copy_from_user()`用于将用户空间的数据传送给内核空间。

    - `write`设备方法通常完成两件事情：**从应用程序提供的地址中取出数据，将数据写入设备**(属于硬件访问类操作)

    - 函数原型：`ssize_t (*write)(struct file *, const char __user *, size_t, loff_t *)`

    - 驱动注销：当我们从内核中卸载驱动程序的时候，需要使用`cdev_del`函数来完成字符设备的注销。

    - 一个驱动程序范例：

    - ```c
      #include <linux/module.h>
      #include <linux/types.h>
      #include <linux/fs.h>
      #include <linux/errno.h>
      #include <linux/init.h>
      #include <linux/cdev.h>
      #include <asm/uaccess.h>
      #include <linux/slab.h>
       
      int dev1_registers[5];
      int dev2_registers[5];
       
      struct cdev cdev; 	// 字符驱动设备
      dev_t devno;	// 设备号
       
      /*文件打开函数*/
      int mem_open(struct inode *inode, struct file *filp)
      {
          /*获取次设备号*/
          int num = MINOR(inode->i_rdev);
       
          if (num==0)
              filp->private_data = dev1_registers;
          else if(num == 1)
              filp->private_data = dev2_registers;
          else
              return -ENODEV;  //无效的次设备号
       
          return 0; 
      }
       
      /*文件释放函数*/
      int mem_release(struct inode *inode, struct file *filp)
      {
        return 0;
      }
       
      /*读函数 返回读取了多少个数据*/
      static ssize_t mem_read(struct file *filp, char __user *buf, size_t size, loff_t *ppos)
      {
        unsigned long p =  *ppos;
        unsigned int count = size;
        int ret = 0;
        int *register_addr = filp->private_data; /*获取设备的寄存器基地址*/
       
        /*判断读位置是否有效*/
        if (p >= 5*sizeof(int))
          return 0;
        if (count > 5*sizeof(int) - p)
          count = 5*sizeof(int) - p;
       
        /*读数据到用户空间 从基地址偏移p个(p为开始读的位置 即ppos描述的相对位置)*/
        if (copy_to_user(buf, register_addr+p, count))
        {
          ret = -EFAULT;
        }
        else
        {
          *ppos += count;
          ret = count;
        }
       
        return ret;
      }
       
      /*写函数*/
      static ssize_t mem_write(struct file *filp, const char __user *buf, size_t size, loff_t *ppos)
      {
        unsigned long p =  *ppos;
        unsigned int count = size;
        int ret = 0;
        int *register_addr = filp->private_data; /*获取设备的寄存器地址*/
       
        /*分析和获取有效的写长度*/
        if (p >= 5*sizeof(int))
          return 0;
        if (count > 5*sizeof(int) - p)
          count = 5*sizeof(int) - p;
       
        /*从用户空间写入数据*/
        if (copy_from_user(register_addr + p, buf, count))
          ret = -EFAULT;
        else
        {
          *ppos += count;
          ret = count;
        }
       
        return ret;
      }
       
      /* seek文件定位函数 */
      static loff_t mem_llseek(struct file *filp, loff_t offset, int whence)
      { 
          loff_t newpos;
       
          switch(whence) {
            case SEEK_SET: 
              newpos = offset;
              break;
       
            case SEEK_CUR: 
              newpos = filp->f_pos + offset;
              break;
       
            case SEEK_END: 
              newpos = 5*sizeof(int)-1 + offset;
              break;
       
            default: 
              return -EINVAL;
          }
          if ((newpos<0) || (newpos>5*sizeof(int)))
              return -EINVAL;
       
          filp->f_pos = newpos;
          return newpos;
       
      }
       
      /*文件操作结构体*/
      static const struct file_operations mem_fops =
      {
        .llseek = mem_llseek,
        .read = mem_read,
        .write = mem_write,
        .open = mem_open,
        .release = mem_release,
      };
       
      /*设备驱动模块加载函数*/
      static int memdev_init(void)
      {
        /*初始化cdev结构*/
        cdev_init(&cdev, &mem_fops);
       
        /* 注册字符设备 */
        alloc_chrdev_region(&devno, 0, 2, "memdev");
        cdev_add(&cdev, devno, 2);
      }
       
      /*模块卸载函数*/
      static void memdev_exit(void)
      {
        cdev_del(&cdev);   /*注销设备*/
        unregister_chrdev_region(devno, 2); /*释放设备号*/
      }
       
      MODULE_LICENSE("GPL");
       
      module_init(memdev_init);
      module_exit(memdev_exit);
      1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

        

### 1.3 总线设备驱动模型

- 自内核2.6版本开始，需要关注的是**总线、设备和驱动**这3个实体，总线将设备和驱动绑定。在Linux内核系统中注册一个设备的时候，会寻找与之对应驱动进行匹配；相反地，系统中注册一个驱动的时候，会去寻找一个对应的设备进行匹配。**匹配的的工作由总线来完成**。

- **在Linux设备中有的是没有对应的物理总线的，但为了适配Linux的总线模型，内核针对这种没有物理总线的设备开发了一种虚拟总线——platform总线**。将设备和驱动独立开，驱动尽可能写的通用，当来了一个类似的设备后也可以使用这个驱动，让驱动程序可以重用。这体现了Linux驱动的软件架构设计的思想。

- 按照这个思路，Linux中的设备和驱动都需要挂接在一种总线上，比如i2c总线上的eeprom，eeprom作为设备，**eeprom的驱动都挂接在i2c驱动上**。但是在嵌入式系统中，**soc系统一般都会集成独立的i2c控制器，控制器也是需要驱动的，但是再按照设备-总线-驱动模型进行设计，就会发现无法找到一个合适总线去挂接控制器设备和控制器驱动了（i2c控制器是挂接在CPU内部的总线上，而不是i2c总线）**，所以Linux发明了一种虚拟总线，称为platform总线，相应的设备称为**platform_device（控制器设备），对应的驱动为platform_driver（控制器驱动），用platform总线来承载这些相对特殊的系统**。

- 注意：**所谓的platform_device并不是与字符设备、块设备和网络设备并列的概念，而是Linux系统提供的一种附加手段**。例如，在 S3C6410处理器中，把内部集成的I2C、RTC、SPI、LCD、看门狗等控制器都归纳为platform_device，而它们本身就是字符设备。我们要记住，platform 驱动只是在**字符设备驱动外套一层platform_driver 的外壳**。引入platform模型符合Linux 设备模型 —— 总线、设备、驱动，设备模型中配套的sysfs节点都可以用，方便我们的开发；**当然你也可以选择不用，不过就失去了一些platform带来的便利**。

- 设备驱动中引入platform 概念，隔离BSP和驱动。在BSP中定义platform设备和设备使用的资源、设备的具体匹配信息，而在驱动中，只需要通过API去获取资源和数据，做到了板相关代码和驱动代码的分离，使得驱动具有更好的可扩展性和跨平台性。

  

  

  - **下面分析下总线设备驱动模型的匹配过程**
    1. 一边的`device`结构体和另一边的`较稳定的 driver 代码`的联系：`device_add()`除将`device`结构放到 bus 的`dev 链表`之外，还会从另一边的`drv`链表中取表元即某个`driver`结构，用总线里的一个`（.match）`函数来作比较，看另一边的`driver`是否支持一边的`device`。若是能够支持，则接着调用软件驱动部分的`.probe`函数。`driver_register()`会将`bus_drv_dev`模型中的较稳定代码`driver`结构体放到虚拟总线的某个链表（drv 链表）中。从另一边的`dev`链表中取出每一个`device`结构用 bus 中的`.match`函数来作比较。
    2. 若支持则调用`.probe`函数。左右两个注册就建立起来的一种机制。在`.probe`函数中做的事件由自已决定，打印一句话，或注册一个字符设备，再或注册一个`input_dev`结构体等等都是由自已决定。强制的把一个驱动程序分为左右两边这种机制而已，可以把这套东西放在任何地方，这里的`driver`只是个结构体不要被这个名字迷惑，`device`也只是个结构体，里面放什么内容都是由自已决定的。

### 1.4 输入子系统模型

每个硬件都有一个`input_dev`结构体，每个软件都有一个`input_handler`结构体。`input_dev`和`input_handler`分别通过`input_register_device()`，`input_register_handler()`向核心层注册硬件和软件。

int input_register_device(struct input_dev *dev) //*dev:要注册的驱动设备
{
… …
list_add_tail(&dev->node, &input_dev_list); //(1)放入链表中
… …
list_for_each_entry(handler, &input_handler_list, node) //(2)
input_attach_handler(dev, handler);
… …
}


- 从`input_dev`方向分析：`input`设备在增加到`input_dev_list`链表上之后，会查找 `input_handler_list`事件处理链表上的`handler`进行匹配，这里的匹配方式与总线设备驱动模型的`device`和`driver`匹配过程很相似，所有的`input_device`都挂在`input_dev_list`上，所有类型的事件都挂在`input_handler_list`上，进行“匹配相亲”。如果匹配上了，就调用`input_handler`的`connect`函数进行连接。设备就是在此时注册的。
- 从`input_handler`方向分析：将`handler`挂到链表`input_handler_list`下，然后遍历`input_dev_list`链表,查找并匹配输入设备对应的事件处理层，如果匹配上了，就调用`connect`函数进行连接，并创建`input_handle`结构。
- 所以，不管新添加`input_dev`还是`input_handler`，都会进入`input_attach_handler()`判断两者id是否有支持, 若两者支持便进行连接。

### 1.5 platform总线的匹配规则是什么？在具体应用上要不要先注册驱动再注册设备？有先后顺序没？

- 匹配规则就是当有一个新的设备挂起时，总线被唤醒，`match`函数被调用，用`device`名字去跟本总线下的所有驱动名字去比较。相反就是用驱动的名字去`device`链表中和所有`device`的名字比较。如果匹配上，才会调用驱动中的`probe`函数，否则不调用。至于先后顺序，鉴于个人理解，**不会有影响**，不管谁先谁后，bus都会完成匹配工作。
- 设备驱动模型的出现主要有三个好处：
  1. 设备与驱动分离，驱动**可移植性增强**；
  2. 设备驱动抽象结构以总线结构表示看起来更加**清晰明了**，谁是属于哪一条bus的；
  3. 设备与驱动分离，很好的奠定了**热插拔**机制。

## 2.Linux内核

### 2.1 内核镜像格式有几种？分别有什么区别？

1. uboot经过编译直接生成的elf格式的可执行程序是u-boot，这个程序类似于windows下的exe格式，在操作系统下是**可以直接执行**的。但是这种格式**不能用来烧录下载**。我们用来烧录下载的是u-boot.bin，这个东西是由u-boot使用arm-linux-objcopy工具进行加工（主要目的是去掉一些无用的东西）得到的。这个u-boot.bin就叫镜像（image），镜像就是用来烧录到iNand中执行的。
2. linux内核经过编译后也会生成一个elf格式的可执行程序，叫**vmlinux或vmlinuz**，这个就是**原始的未经任何处理加工的原版内核elf文件**；嵌入式系统部署时烧录的一般不是这个vmlinuz/vmlinux，而是要用objcopy工具去制作成烧录镜像格式（就是u-boot.bin这种，但是内核没有.bin后缀），经过制作加工成烧录镜像的文件就叫**Image**（制作把78M大的精简成了7.5M，因此这个制作烧录镜像主要目的就是缩减大小，节省磁盘）。
3. 原则上Image就可以直接被烧录到Flash上进行启动执行（类似于u-boot.bin），但是实际上并不是这么简单。实际上linux的作者们觉得Image还是太大了所以对Image进行了压缩，并且在image压缩后的文件的**前端附加了一部分解压缩代码**。构成了一**个压缩格式的镜像就叫zImage**。（因为当年Image大小刚好比一张软盘（软盘有2种，1.2M的和1.44MB两种）大，为了节省1张软盘的钱于是乎设计了这种压缩Image成zImage的技术）。
4. uboot为了启动linux内核，还发明了一种内核格式叫uImage。**uImage是由zImage加工得到的**，uboot中有一个工具，可以将zImage加工生成uImage。注意：uImage不关linux内核的事，linux内核只管生成zImage即可，然后uboot中的mkimage工具再去由zImage加工生成uImage来给uboot启动。这个加工过程其实就是**在zImage前面加上64字节的uImage的头信息即可**。
5. 原则上uboot启动时应该给他uImage格式的内核镜像，但是实际上uboot中也可以支持zImage，是否支持就看x210_sd.h中是否定义了LINUX_ZIMAGE_MAGIC这个宏。所以大家可以看出：有些uboot是支持zImage启动的，有些则不支持。但是**所有的uboot肯定都支持uImage启动**。
6. 如果直接在kernel底下去`make uImage`会提供`mkimage command not found`。解决方案是去`uboot/tools`下`cp mkimage /usr/local/bin/`，复制mkimage工具到系统目录下。再去`make uImage`即可。

> 通过上面的介绍我们了解了内核镜像的各种格式，如果通过uboot启动内核，Linux必须为**uImage**格式。

### 2.2 内核中申请内存有哪几个函数？有什么区别？

1. **kmalloc**

   ```c
   void *kmalloc(size_t size, gfp_t flags)

kmalloc是内核中最常用的一种内存分配方式，它通过调用kmem_cache_alloc函数来实现。kmalloc一次最多能申请的内存大小由include/linux/Kmalloc_size.h的内容来决定，在默认的2.6.18内核版本中，kmalloc一次最多能申请大小为131702B也就是128KB字节的连续物理内存。测试结果表明，如果试图用kmalloc函数分配大于128KB的内存，编译不能通过。

vmalloc
1
void *vmalloc(unsigned long size)
前面几种内存分配方式都是物理连续的，能保证较低的平均访问时间。但是在某些场合中，对内存区的请求不是很频繁，较高的内存访问时间也可以接受，这是就可以分配一段线性连续，物理不连续的地址，带来的好处是一次可以分配较大块的内存。图3-1表示的是vmalloc分配的内存使用的地址范围。vmalloc对一次能分配的内存大小没有明确限制。出于性能考虑，应谨慎使用vmalloc函数。在测试过程中，最大能一次分配1GB的空间。
dma_alloc_coherent
1
2
void *dma_alloc_coherent(struct device *dev, size_t size,ma_addr_t
*dma_handle, gfp_t gfp)
DMA(直接内存访问 Direct Memory Access)是一种硬件机制，允许外围设备和主存之间直接传输IO数据，而不需要CPU的参与，使用DMA机制能大幅提高与设备通信的吞吐量。DMA操作中，涉及到CPU高速缓存和对应的内存数据一致性的问题，必须保证两者的数据一致，在x86_64体系结构中，硬件已经很好的解决了这个问题，dma_alloc_coherentget_free_pages函数实现差别不大，前者实际是调用alloc_pages函数来分配内存，因此一次分配内存的大小限制和后者一样。__get_free_pages分配的内存同样可以用于DMA操作。测试结果证明，dma_alloc_coherent函数一次能分配的最大内存也为4M。
ioremap
1
void * ioremap (unsigned long offset, unsigned long size)
ioremap是一种更直接的内存“分配”方式，使用时直接指定物理起始地址和需要分配内存的大小，然后将该段物理地址映射到内核地址空间。ioremap用到的物理地址空间都是事先确定的，和上面的几种内存分配方式并不太一样，并不是分配一段新的物理内存。ioremap多用于设备驱动，可以让CPU直接访问外部设备的IO空间。ioremap能映射的内存由原有的物理内存空间决定，所以没有进行测试。

2.3 什么是内核空间，用户空间？

对 32 位操作系统而言，它的寻址空间（虚拟地址空间，或叫线性地址空间）为 4G（2的32次方）。也就是说一个进程的最大地址空间为 4G。
操作系统的核心是内核(kernel)，它独立于普通的应用程序，可以访问受保护的内存空间，也有访问底层硬件设备的所有权限。为了保证内核的安全，现在的操作系统一般都强制用户进程不能直接操作内核。具体的实现方式基本都是由操作系统将虚拟地址空间划分为两部分，一部分为内核空间，另一部分为用户空间。针对 Linux 操作系统而言，最高的 1G 字节(从虚拟地址 0xC0000000 到 0xFFFFFFFF)由内核使用，称为内核空间。而较低的 3G 字节(从虚拟地址 0x00000000 到 0xBFFFFFFF)由各个进程使用，称为用户空间。
对上面这段内容我们也可以这样理解：
每个进程的 4G 地址空间中，最高 1G 都是一样的，即内核空间。只有剩余的 3G 才归进程自己使用。换句话说就是，最高 1G 的内核空间是被所有进程共享的！
下图描述了每个进程 4G 地址空间的分配情况：

2.4 为什么需要区分内核空间与用户空间？

在 CPU 的所有指令中，有些指令是非常危险的，如果错用，将导致系统崩溃，比如清内存、设置时钟等。如果允许所有的程序都可以使用这些指令，那么系统崩溃的概率将大大增加。
所以，CPU 将指令分为特权指令和非特权指令，对于那些危险的指令，只允许操作系统及其相关模块使用，普通应用程序只能使用那些不会造成灾难的指令。比如 Intel 的 CPU 将特权等级分为 4 个级别：Ring0~Ring3。
其实 Linux 系统只使用了 Ring0 和 Ring3 两个运行级别(Windows 系统也是一样的)。当进程运行在 Ring3 级别时被称为运行在用户态，而运行在 Ring0 级别时被称为运行在内核态。

2.5 什么是内核态和用户态？

当进程运行在内核空间时就处于内核态，而进程运行在用户空间时则处于用户态。
在内核态下，进程运行在内核地址空间中，此时 CPU 可以执行任何指令。运行的代码也不受任何的限制，可以自由地访问任何有效地址，也可以直接进行端口的访问。
在用户态下，进程运行在用户地址空间中，被执行的代码要受到 CPU 的诸多检查，它们只能访问映射其地址空间的页表项中规定的在用户态下可访问页面的虚拟地址，且只能对任务状态段(TSS)中 I/O 许可位图(I/O Permission Bitmap)中规定的可访问端口进行直接访问。
对于以前的 DOS 操作系统来说，是没有内核空间、用户空间以及内核态、用户态这些概念的。可以认为所有的代码都是运行在内核态的，因而，用户编写的应用程序代码可以很容易的让操作系统崩溃掉。
对于 Linux 来说，通过区分内核空间和用户空间的设计，隔离了操作系统代码(操作系统的代码要比应用程序的代码健壮很多)与应用程序代码。即便是单个应用程序出现错误，也不会影响到操作系统的稳定性，这样其它的程序还可以正常的运行(Linux 可是个多任务系统啊！)。所以，区分内核空间和用户空间本质上是要提高操作系统的稳定性及可用性。
2.6 用户空间与内核通信方式有哪些？

使用API

1
2
3

get_user(x，ptr) //在内核中被调用，获取用户空间指定地址的数值并保存到内核变量x中。
put_user(x，ptr) //在内核中被调用，将内核空间的变量x的数值保存到到用户空间指定地址处。
copy_from_user()/copy_to_user() //主要应用于设备驱动读写函数中，通过系统调用触发。

使用proc文件系统
和sysfs文件系统类似，也可以作为内核空间和用户空间交互的手段。/proc 文件系统是一种虚拟文件系统，通过他可以作为一种linux内核空间和用户空间的桥梁。与普通文件不同，这里的虚拟文件的内容都是动态创建的。使用/proc文件系统的方式很简单。调用create_proc_entry，返回一个proc_dir_entry指针，然后去填充这个指针指向的结构就好了。(相当于proc为用户空间的进程开了个口访问内核空间)
使用sysfs文件系统+kobject
每个在内核中注册的kobject都对应着sysfs系统中的一个目录。可以通过读取根目录下的sys目录中的文件来获得相应的信息。除了sysfs文件系统和proc文件系统之外，一些其他的虚拟文件系统也能同样达到这个效果。
netlink
netlink socket提供了一组类似于BSD风格的API，用于用户态和内核态的IPC。相比于其他的用户态和内核态IPC机制，netlink有几个好处：1.使用自定义一种协议完成数据交换，不需要添加一个文件等。2.可以支持多点传送。3.支持内核先发起会话。4.异步通信，支持缓存机制。
文件
应该说这是一种比较笨拙的做法，不过确实可以这样用。当处于内核空间的时候，直接操作文件，将想要传递的信息写入文件，然后用户空间可以读取这个文件便可以得到想要的数据了。下面是一个简单的测试程序，在内核态中，程序会向/home/melody/str_from_kernel文件中写入一条字符串，然后我们在用户态读取这个文件，就可以得到内核态传输过来的数据了。
使用mmap系统调用
可以将内核空间的地址映射到用户空间。在以前做嵌入式的时候用到几次。一方面可以在driver中修改Struct file_operations结构中的mmap函数指针来重新实现一个文件对应的映射操作。另一方面，也可以直接打开/dev/mem文件，把物理内存中的某一页映射到进程空间中的地址上。其实，除了重写Struct file_operations中mmap函数，我们还可以重写其他的方法如ioctl等，来达到驱动内核空间和用户空间通信的方式。
信号
从内核空间向进程发送信号。这个倒是经常遇到，用户程序出现重大错误，内核发送信号杀死相应进程。

2.7 内核链表为什么具有通用性？

内核中由于要管理大量的设备，但是各种设备各不相同，必须将他们统一起来管理，于是内核设计者就想到了使用通用链表来处理，通用链表看似神秘，实际上就是双向循环链表，这个链表的每个节点都是只有指针域，没有任何数据域。

使用通用链表的好处是：
1. 通用链表中每个节点中没有数据域，也就是说无论数据结构有多复杂在链表中只有前后级指针。
2. 如果一个数据结构（即是描述设备的设备结构体）想要用通用链表管理，只需要在结构体中包含节点的字段即可。
3. 双向链表可以从任意一个节点的前后遍历整个链表，遍历非常方便。
4. 使用循环链表使得可以不断地循环遍历管理节点，像进程的调度：操作系统会把就绪的进程放在一个管理进程的就绪队列的通用链表中管理起来，循环不断地，为他们分配时间片，获得cpu进行周而复始的进程调度。

2.8 应用程序中open()在linux中执行过程中是如何从用户空间到内核空间？

应用层调用open函数，在VFS层中找到struct inode结构体，判断是字符设备还是块设备，根据设备号，可以找到对应的驱动程序。
在驱动层中，每个字符设备都有一个struct cdev结构体，这个结构体通过struct inode结构体中的i_cdev把连接起VFS层和驱动层，struct cdev结构体描述了字符设备所有信息，其中最重要的一项就是字符设备的操作函数接口，即const struct file_operations *ops
struct cdev结构体中的struct file结构体记录了操作字符设备的一些函数，比如open read write函数等。struct file结构体其实是在VFS层的，通过struct file结构体指针指向驱动层的struct file结构体将驱动层函数和VFS层链接起来
任务完成，VFS层会给应用返回一个文件描述符（fd）。这个fd是和struct file结构体对应的。

3.设备驱动

3.1 请简述主设备号和次设备号的用途

主设备号：主设备号标识设备对应的特定的驱动程序。虽然现代的linux内核允许多个驱动程序共享主设备号，但我们看待的大多数设备仍然按照“一个主设备对应一个驱动程序”的原则组织
次设备号：次设备号由内核使用，用于确定由主设备号对应驱动程序中的各个设备。依赖于驱动程序的编写方式，我们可以通过次设备号获得一个指向内核设备的直接指针，也可将此设备号当作设备本地数组的索引。

3.2 字符型驱动设备怎么创建设备文件？

手动创建
mknod /dev/led c 250 0 ，其中dev/led为设备节点 ,c 代表字符设备, 250代表主设备号, 0代表次设备号。
自动创建
UDEV/MDEV是运行在用户态的程序，可以动态管理设备文件，包括创建和删除设备文件，运行在用户态意味着系统要运行之后，在 /etc/init.d/rcS 脚本文件中会执行 mdev -s 自动创建设备节点。

3.3 设备驱动程序中如何注册一个字符设备？分别解释一下它的几个参数的含义

注册一个字符设备驱动有两种方法：
1. void cdev_init(struct cdev *cdev, struct file_operations *fops) 该注册函数可以将cdev结构嵌入到自己的设备特定的结构中。cdev是一个指向结构体cdev的指针，而fops是指向一个类似于 file_operations结构（可以是file_operations结构，但不限于该结构）的指针。
2. int register_chrdev(unsigned int major, const char *name, struct file operations *fops)；该注册函数是早期的注册函数，major是设备的主设备号，name是驱动程序的名称，而fops是默认的file_operations结构（这是只限于file_operations结构）。对于register_chrdev的调用将为给定的主设备号注册0－255作为次设备号，并为每个设备建立一个对应的默认cdev结构。
3.4 /dev/下面的设备文件是怎么创建出来的？
普遍说法有三种方式，devfs机制，udev机制，再有一个就是手动创建设备节点。谈谈个人见解：

devfs机制从来没用过，应该是2.6以前的内核使用的；
udev：其实就是现在常用的device_create()、class_create()这一套接口，所谓udev是上层用户空间程序，是基于驱动中创建使用了这两个接口而起作用的，但是udev在日常开发中几乎接触不到，我们只需在驱动中调用创建节点的这两个API就ok了，剩下的工作就交给udev去做了，有想深究它具体实现原理的那就自己去研究吧，我觉得会用就行了；
mknod：新手最常用的一种创建设备节点方法，但并非入门后就再没有用途，在某些情境下，或许有人不想使用udev机制，于是把节点创建工作写在脚本里，这样也是无可厚非的。

3.5 Linux设备中字符设备和块设备有什么主要区别？分别举例。

Linux中I/O设备分为两类：块设备和字符设备。两种设备本身没有严格限制，但是，基于不同的功能进行了分类。
字符设备：提供连续的数据流，应用程序可以顺序读取，通常不支持随机存取。相反，此类设备支持按字节/字符来读写数据。字符终端、串口、鼠标、键盘、摄像头、声卡和显卡等就是典型的字符设备。
块设备：应用程序可以随机访问设备数据，程序可自行确定读取数据的位置。硬盘是典型的块设备，应用程序可以寻址磁盘上的任何位置，并由此读取数据。此外，数据的读写只能以块(通常是512B)的倍数进行。与字符设备不同，块设备并不支持基于字符的寻址。如：u盘，SD卡，磁盘等。

3.6 驱动中操作物理绝对地址为什么要先ioremap？

ioremp是内核中用来将外设寄存器物理地址映射到主存上去的接口，即将io地址空间映射到虚拟地址空间上去，便于操作。为什么非要映射呢，因为保护模式下的cpu只认虚拟地址，不认物理地址，给它物理地址它并不帮你做事，所以你要操作外设上的寄存器必须先映射到虚拟内存空间，拿着虚拟地址去跟cpu对接，从而操作寄存器。

3.7 insmod，rmmod一个驱动模块，会执行模块中的哪个函数？在设计上要注意哪些问题？

分别会执行module_init()和module_exit()指定的init函数和exit函数。要注意的就是，尽量使在init函数中出现的资源申请及使用，都要有对应的释放操作在exit中，即init申请，eixt释放。

3.8 NAND驱动的probe流程

probe 函数就会与NAND芯片进行，主要做的事情主要包括这几个方面：读取NAND芯片的ID ，然后查表得到这片NAND芯片的如厂商，page size，erase size以及chip size等信息，接着根据struct nand_chip 中options的值的不同，或者在NAND 芯片中的特定位置查找bad block table，或者scan整个NAND 芯片，并在内存中建立bad block table。说起来复杂，但其实所有的这些动作，都可以在MTD提供的一个叫做nand_scan的函数中完成。

3.9 Linux驱动开发中，常用的调试方法有哪些？

利用printk，查看OOP消息，利用strace，利用内核内置的hacking选项，利用ioctl方法，利用/proc 文件系统，使用kgdb。
strace 是一个可用于诊断、调试和教学的 Linux 用户空间跟踪器，监控用户空间进程和内核的交互，比如系统调用、信号传递、进程状态变更等。
ioctl 是设备驱动程序中设备控制接口函数，一个字符设备驱动通常会实现设备打开、关闭、读、写等功能，在一些需要细分的情境下，如果需要扩展新的功能，通常以增设ioctl()命令的方式实现。
建议大家，亲手动手调试下。面试中，很大可能会问你，在写驱动过程中遇到了什么问题的，如何解决的？如果你能讲出以上几种调试方法中的一两种，一定会让面试官刮目相看！