Proxmox VE 管理指南

/dev/pve/vz /var/lib/vz ext4 defaults 0 2

# apt-get install perl liblocale-po-perl libjson-perl
# dd bs=1M conv=fdatasync if=./proxmox-ve_*.iso of=/dev/XYZ
# lsblk
# lsblk
# hdiutil convert proxmox-ve_*.iso -format UDRW -o proxmox-ve_*.dmg
# diskutil list
# diskutil list
# diskutil unmountDisk /dev/diskX
# sudo dd if=proxmox-ve_*.dmg bs=1M of=/dev/rdiskX
# zpool add <pool-name> log </dev/path_to_fast_ssd>
# apt-get update
# apt-get install proxmox-ve
deb http://deb.debian.org/debian bookworm main contrib
deb http://deb.debian.org/debian bookworm-updates main contrib

# security updates
deb http://security.debian.org/debian-security bookworm-security main contrib
deb https://enterprise.proxmox.com/debian/pve bookworm pve-enterprise
deb http://ftp.debian.org/debian bookworm main contrib
deb http://ftp.debian.org/debian bookworm-updates main contrib

# Proxmox VE pve-no-subscription repository provided by proxmox.com,
# NOT recommended for production use
deb http://download.proxmox.com/debian/pve bookworm pve-no-subscription

# security updates
deb http://security.debian.org/debian-security bookworm-security main contrib
deb http://download.proxmox.com/debian/pve bookworm pvetest
deb https://enterprise.proxmox.com/debian/ceph-reef bookworm enterprise
deb http://download.proxmox.com/debian/ceph-reef bookworm no-subscription
deb http://download.proxmox.com/debian/ceph-reef bookworm test
deb https://enterprise.proxmox.com/debian/ceph-quincy bookworm enterprise
deb http://download.proxmox.com/debian/ceph-quincy bookworm no-subscription
deb http://download.proxmox.com/debian/ceph-quincy bookworm test
# wget https://enterprise.proxmox.com/debian/proxmox-release-bookworm.gpg -O /etc/apt/trusted.gpg.d/proxmox-release-bookworm.gpg
# sha512sum /etc/apt/trusted.gpg.d/proxmox-release-bookworm.gpg
7da6fe34168adc6e479327ba517796d4702fa2f8b4f0a9833f5ea6e6b48f6507a6da403a274fe201595edc86a84463d50383d07f64bdde2e3658108db7d6dc87 /etc/apt/trusted.gpg.d/proxmox-release-bookworm.gpg
# md5sum /etc/apt/trusted.gpg.d/proxmox-release-bookworm.gpg
41558dc019ef90bd0f6067644a51cf5b /etc/apt/trusted.gpg.d/proxmox-release-bookworm.gpg
# apt-get update
# apt-get dist-upgrade
# grep microcode /proc/cpuinfo | uniq
microcode	: 0xf0
# dmesg | grep microcode
[    0.000000] microcode: microcode updated early to revision 0xf0, date = 2021-11-12
[    0.896580] microcode: Microcode Update Driver: v2.2.
# apt list -a intel-microcode
Listing... Done
intel-microcode/stable-security,now 3.20230808.1~deb12u1 amd64 [installed]
intel-microcode/stable 3.20230512.1 amd64
# apt install intel-microcode=3.202305*
...
选定的版本 '3.20230512.1' (Debian:12.1/stable [amd64]) 对应 'intel-microcode'
...
dpkg: 警告: 从 3.20230808.1~deb12u1 降级到 3.20230512.1
...
intel-microcode: 下一次启动时将更新微码
...
# apt-mark hold intel-microcode
intel-microcode set on hold.
# apt-mark unhold intel-microcode
# apt update
# apt upgrade
net.naming-scheme=v252
[Match]
MACAddress=aa:bb:cc:dd:ee:ff

[Link]
Name=enwan0
auto lo
iface lo inet loopback

iface eno1 inet manual

auto vmbr0
iface vmbr0 inet static
        address 192.168.10.2/24
        gateway 192.168.10.1
        bridge-ports eno1
        bridge-stp off
        bridge-fd 0
auto lo
iface lo inet loopback

auto eno0
iface eno0 inet static
        address  198.51.100.5/29
        gateway  198.51.100.1
        post-up echo 1 > /proc/sys/net/ipv4/ip_forward
        post-up echo 1 > /proc/sys/net/ipv4/conf/eno0/proxy_arp

auto vmbr0
iface vmbr0 inet static
        address  203.0.113.17/28
        bridge-ports none
        bridge-stp off
        bridge-fd 0
auto lo
iface lo inet loopback

auto eno1
#real IP address
iface eno1 inet static
        address  198.51.100.5/24
        gateway  198.51.100.1

auto vmbr0
#private sub network
iface vmbr0 inet static
        address  10.10.10.1/24
        bridge-ports none
        bridge-stp off
        bridge-fd 0

post-up   echo 1 > /proc/sys/net/ipv4/ip_forward
        post-up   iptables -t nat -A POSTROUTING -s '10.10.10.0/24' -o eno1 -j MASQUERADE
        post-down iptables -t nat -D POSTROUTING -s '10.10.10.0/24' -o eno1 -j MASQUERADE
post-up   iptables -t raw -I PREROUTING -i fwbr+ -j CT --zone 1
post-down iptables -t raw -D PREROUTING -i fwbr+ -j CT --zone 1
auto lo
iface lo inet loopback

iface eno1 inet manual

iface eno2 inet manual

iface eno3 inet manual

auto bond0
iface bond0 inet static
      bond-slaves eno1 eno2
      address  192.168.1.2/24
      bond-miimon 100
      bond-mode 802.3ad
      bond-xmit-hash-policy layer2+3

auto vmbr0
iface vmbr0 inet static
        address  10.10.10.2/24
        gateway  10.10.10.1
        bridge-ports eno3
        bridge-stp off
        bridge-fd 0
auto lo
iface lo inet loopback

iface eno1 inet manual

iface eno2 inet manual

auto bond0
iface bond0 inet manual
      bond-slaves eno1 eno2
      bond-miimon 100
      bond-mode 802.3ad
      bond-xmit-hash-policy layer2+3

auto vmbr0
iface vmbr0 inet static
        address  10.10.10.2/24
        gateway  10.10.10.1
        bridge-ports bond0
        bridge-stp off
        bridge-fd 0
auto lo
iface lo inet loopback

iface eno1 inet manual

iface eno1.5 inet manual

auto vmbr0v5
iface vmbr0v5 inet static
        address  10.10.10.2/24
        gateway  10.10.10.1
        bridge-ports eno1.5
        bridge-stp off
        bridge-fd 0

auto vmbr0
iface vmbr0 inet manual
        bridge-ports eno1
        bridge-stp off
        bridge-fd 0
auto lo
iface lo inet loopback

iface eno1 inet manual

auto vmbr0.5
iface vmbr0.5 inet static
        address  10.10.10.2/24
        gateway  10.10.10.1

auto vmbr0
iface vmbr0 inet manual
        bridge-ports eno1
        bridge-stp off
        bridge-fd 0
        bridge-vlan-aware yes
        bridge-vids 2-4094
auto lo
iface lo inet loopback

iface eno1 inet manual

iface eno2 inet manual

auto bond0
iface bond0 inet manual
      bond-slaves eno1 eno2
      bond-miimon 100
      bond-mode 802.3ad
      bond-xmit-hash-policy layer2+3

iface bond0.5 inet manual

auto vmbr0v5
iface vmbr0v5 inet static
        address  10.10.10.2/24
        gateway  10.10.10.1
        bridge-ports bond0.5
        bridge-stp off
        bridge-fd 0

auto vmbr0
iface vmbr0 inet manual
        bridge-ports bond0
        bridge-stp off
        bridge-fd 0
net.ipv6.conf.all.disable_ipv6 = 1
net.ipv6.conf.default.disable_ipv6 = 1
# ...

auto vmbr0
iface vmbr0 inet static
        address  10.10.10.2/24
        gateway  10.10.10.1
        bridge-ports ens18
        bridge-stp off
        bridge-fd 0
        bridge-disable-mac-learning 1
server ntp1.example.com iburst
server ntp2.example.com iburst
server ntp3.example.com iburst
...
Aug 26 13:00:09 node1 systemd[1]: 已启动 Chrony，一个NTP客户端/服务器。
Aug 26 13:00:15 node1 chronyd[4873]: 已选择源 10.0.0.1 (ntp1.example.com)
Aug 26 13:00:15 node1 chronyd[4873]: 系统时钟TAI偏移设置为37秒
...
[Time]
NTP=ntp1.example.com ntp2.example.com ntp3.example.com ntp4.example.com
...
Oct 07 14:58:36 node1 systemd[1]: Stopping Network Time Synchronization...
Oct 07 14:58:36 node1 systemd[1]: Starting Network Time Synchronization...
Oct 07 14:58:36 node1 systemd[1]: Started Network Time Synchronization.
Oct 07 14:58:36 node1 systemd-timesyncd[13514]: Using NTP server 10.0.0.1:123 (ntp1.example.com).
Oct 07 14:58:36 node1 systemd-timesyncd[13514]: interval/delta/delay/jitter/drift 64s/-0.002s/0.020s/0.000s/-31ppm
...
[[udp]]
   enabled = true
   bind-address = "0.0.0.0:8089"
   database = "proxmox"
   batch-size = 1000
   batch-timeout = "1s"
# smartctl -a /dev/sdX
SMART支持是：禁用
# smartctl -s on /dev/sdX
# pvs
  PV         VG   Fmt  Attr PSize PFree
  /dev/sda3  pve  lvm2 a--  7.87g 876.00m

# vgs
  VG   #PV #LV #SN Attr   VSize VFree
  pve    1   3   0 wz--n- 7.87g 876.00m
# lvs
  LV   VG   Attr       LSize   Pool Origin Data%  Meta%
  data pve  twi-a-tz--   4.38g             0.00   0.63
  root pve  -wi-ao----   1.75g
  swap pve  -wi-ao---- 896.00m
# pvcreate --metadatasize 250k -y -ff /dev/sdb1
# vgcreate vmdata /dev/sdb1
# lvcreate -n <Name> -V <Size[M,G,T]> <VG>/<LVThin_pool>
zfspool: local-zfs
	pool rpool/data
	sparse
	content images,rootdir
# zpool status
  pool: rpool
 state: ONLINE
  scan: none requested
config:

NAME        STATE     READ WRITE CKSUM
	rpool       ONLINE       0     0     0
	  mirror-0  ONLINE       0     0     0
	    sda2    ONLINE       0     0     0
	    sdb2    ONLINE       0     0     0
	  mirror-1  ONLINE       0     0     0
	    sdc     ONLINE       0     0     0
	    sdd     ONLINE       0     0     0

错误：没有已知的数据错误
# zfs list
NAME               USED  AVAIL  REFER  MOUNTPOINT
rpool             4.94G  7.68T    96K  /rpool
rpool/ROOT         702M  7.68T    96K  /rpool/ROOT
rpool/ROOT/pve-1   702M  7.68T   702M  /
rpool/data          96K  7.68T    96K  /rpool/data
rpool/swap        4.25G  7.69T    64K  -
# zfs get volsize,refreservation,used <pool>/vm-<vmid>-disk-X
# man zpoolconcepts
# man zpool
# man zfs
-----

[[sysadmin_zfs_create_new_zpool]]
创建一个新的zpool
^^^^^^^^^^^

要创建一个新的存储池，至少需要一块磁盘。`ashift`应该具有与底层磁盘相同的扇区大小（`ashift`的2的幂）或更大。
[TIP]
====
池名称必须遵守以下规则：

* 以一个字母（a-z或A-Z）开头
* 仅包含字母数字字符、`-`、`_`、`.`、`:` 或空格(` `)字符。
* 不能以`mirror`、`raidz`、`draid`或`spare`为开头
* 不得为 `log
====

要激活压缩（参见章节<<zfs_compression,ZFS中的压缩>>）：
[[sysadmin_zfs_create_new_zpool_raid0]]
创建一个新的RAID-0池
^^^^^^^^^^^^^

最少1个磁盘
[[sysadmin_zfs_create_new_zpool_raid1]]
创建一个带有RAID-1的新存储池
^^^^^^^^^^^^^^^^^

至少2个磁盘
[[sysadmin_zfs_create_new_zpool_raid10]]
创建一个使用RAID-10的新池
^^^^^^^^^^^^^^^^

最少4个磁盘
[[sysadmin_zfs_create_new_zpool_raidz1]]
创建一个带有RAIDZ-1的新池
^^^^^^^^^^^^^^^^

最少3个磁盘
创建一个使用RAIDZ-2的新存储池
^^^^^^^^^^^^^^^^^^

最少4个磁盘
请阅读xref:sysadmin_zfs_raid_considerations[ZFS RAID 级别考虑]部分，以便在设置池时，特别是想要使用 RAID-Z 模式时，获得 IOPS 和带宽预期的大致估计。

[[sysadmin_zfs_create_new_zpool_with_cache]]
创建一个带有缓存（L2ARC）的新池
^^^^^^^^^^^^^^^^^^

可以使用专用设备或分区作为二级缓存以提高性能。这样的缓存设备尤其有助于大部分数据相对静态的随机读取工作负载。由于它充当实际存储和内存中的ARC之间的额外缓存层，因此如果由于内存限制需要减少ARC的大小，它也可以提供帮助。

.创建一个带有磁盘缓存的ZFS池
这里只使用了一个`<device>`和一个`<cache-device>`，但是可以使用更多设备，就像在xref:sysadmin_zfs_create_new_zpool_raid0[使用RAID创建新池]中所展示的那样。

请注意，对于缓存设备不存在镜像或RAID模式，它们都是简单地累加起来的。

如果任何缓存设备在读取时产生错误，ZFS将透明地将该请求转向底层存储层。

[[sysadmin_zfs_create_new_zpool_with_log]]
创建一个带有日志(ZIL)的新池子
^^^^^^^^^^^^^^^^^

可以使用专用的驱动器或分区作为ZFS意图日志（ZIL），它主要用于提供安全的同步事务，因此经常用在性能关键路径上，比如数据库，或者其他更频繁发出`fsync`操作的程序。

池作为默认的ZIL位置，将ZIL IO负载转移到一个单独的设备上，可以在缓解主池的同时，帮助减少事务延迟，提高整体性能。

将磁盘用作日志设备，无论是直接使用还是通过分区，建议：

- 使用具有断电保护的快速SSD，因为这些设备的提交延迟要小得多。

- 为分区（或整个设备）至少分配几GB的空间，但使用超过您已安装内存一半以上的空间并不会为您带来任何真正的好处。

.创建具有独立日志设备的ZFS池
在上面的例子中使用了单个`<device>`和单个`<log-device>`，但是您也可以将其与其他RAID变体结合使用，如xref:sysadmin_zfs_create_new_zpool_raid0[创建一个新的具有RAID的池]部分所述。

你也可以将日志设备镜像到多个设备上，这主要是为了确保如果单个日志设备出现故障，性能不会立即下降。

如果所有的日志设备都失败了，ZFS主池本身将再次被使用，直到日志设备被替换。

[[sysadmin_zfs_add_cache_and_log_dev]]
将缓存和日志添加到现有资源池中
^^^^^^^^^^^^^^^

如果你有一个没有缓存和日志的池，你仍然可以在任何时候添加它们中的一个或两个。

例如，假设你有一块带有断电保护功能的优质企业级SSD，你想用它来提升你的池（pool）的整体性能。

日志设备的最大大小应该约为已安装物理内存的一半，这意味着ZIL大多数情况下只会占用SSD的一小部分，剩余空间可以用作缓存。

首先你需要使用`parted`或`gdisk`在SSD上创建两个GPT分区。

那么你就可以将它们添加到资源池中：

.将一个单独的日志设备和二级缓存同时添加到现有的资源池中。
只需将 `<pool>`、`<device-part1>` 和 `<device-part2>` 分别替换为池名称以及指向分区的两个 `/dev/disk/by-id/` 路径。

你也可以分别添加ZIL和缓存。

.向现有的ZFS池添加一个日志设备
[[sysadmin_zfs_change_failed_dev]]
更换失败的设备
^^^^^^^
.更换失败的可启动设备

根据{pve}的安装方式，它要么是使用`systemd-boot`，要么通过`proxmox-boot-tool`使用GRUB footnote:[系统安装了{pve} 6.4或更高版本，EFI系统安装了{pve} 5.4或更高版本]，或者使用普通的GRUB作为引导程序（见xref:sysboot[主机引导程序]）。您可以通过运行以下命令来检查：
复制分区表、重新发行GUID以及替换ZFS分区的首要步骤是相同的。为了使系统能够从新磁盘启动，需要执行不同的步骤，这些步骤取决于所使用的引导加载程序。
NOTE: 使用 `zpool status -v` 命令来监控新磁盘的重银化（resilvering）进程的进展情况。

.使用 `proxmox-boot-tool`：
NOTE: "`ESP` 代表 EFI 系统分区，这是由 {pve} 安装程序自版本 5.4 起在可启动磁盘上设置为分区＃2。有关详细信息，请参阅 xref:sysboot_proxmox_boot_setup[设置新分区以用作同步的 ESP]。"

NOTE: 如果`proxmox-boot-tool status`显示您当前的磁盘正在使用GRUB，特别是当启用了Secure Boot时，请确保以'grub'模式传递给`proxmox-boot-tool init`！

.使用普通的GRUB:
NOTE: 普通的GRUB只在安装了{pve} 6.3或更早版本的系统上使用，这些系统尚未手动迁移到使用`proxmox-boot-tool`。

配置电子邮件通知
~~~~~~~~

ZFS附带一个事件守护进程`ZED`，它监控ZFS内核模块生成的事件。守护进程还可以在发生ZFS事件（如池错误）时发送电子邮件。较新的ZFS包将守护进程分包在一个独立的`zfs-zed`包中，通常情况下这个包在{pve}中应该已经默认安装。

你可以通过你最喜欢的编辑器在文件`/etc/zfs/zed.d/zed.rc`中配置守护进程。电子邮件通知所需的设置是`ZED_EMAIL_ADDR`，默认设置为`root`。

--------
ZED_EMAIL_ADDR="root"
--------

请注意，{pve} 将邮件转发给 `root` 用户配置的电子邮件地址。

[[sysadmin_zfs_limit_memory_usage]]
限制ZFS内存使用
~~~~~~~~~

默认情况下，ZFS会使用主机内存的'50%'来作为**自适应替换缓存**（Adaptive Replacement Cache，简称ARC）。对于从{pve} 8.1开始的新安装，ARC的使用限制将被设置为安装的物理内存的'10%'，并限制在最大+16 GiB+。该值将被写入到`/etc/modprobe.d/zfs.conf`中。

为ARC分配足够的内存对于IO性能至关重要，因此请谨慎减少它。作为一个一般的经验法则，至少应该分配+2 GiB基础内存+每TiB存储空间增加1 GiB。例如，如果你有一个+8 TiB+的可用存储空间的池子，那么你应该为ARC使用+10 GiB+的内存。

ZFS 也强制执行最小值 +64 MiB+。

您可以通过直接写入+zfs_arc_max+模块参数来更改当前启动的ARC使用限制（重启会再次重置此更改）：
要**永久更改**ARC限制，请在`/etc/modprobe.d/zfs.conf`文件中添加（或修改已存在的）以下行：

--------
options zfs zfs_arc_max=8589934592
--------

这个示例设置将使用限制为8 GiB（'8 * 2^30^'）。

IMPORTANT: 如果您想要设置的+zfs_arc_max+值小于等于+zfs_arc_min+（其默认值为系统内存的1/32），则除非您同时将+zfs_arc_min+设为最多+zfs_arc_max - 1+，否则+zfs_arc_max+将会被忽略。
这个示例设置（临时）将内存使用限制在8 GiB（'8 * 2^30'）, 适用于总内存超过256 GiB的系统，在这些系统中，仅设置+zfs_arc_max+是不起作用的。

[IMPORTANT]
====
如果您的根文件系统是ZFS，每次这个值发生变化时，您都必须更新您的initramfs：
你*必须重启*电脑来激活这些更改。
====

[[zfs_swap]]
在ZFS上交换
~~~~~~~

在zvol上创建的交换空间可能会引起一些问题，比如阻塞服务器或产生高IO负载，这种情况常在启动对外部存储的备份时看到。

我们强烈建议使用足够的内存，这样通常不会遇到内存不足的情况。如果你需要或希望添加交换空间，建议在物理磁盘上创建一个分区并将其用作交换设备。你可以在安装程序的高级选项中预留一些空间用于此目的。此外，你可以降低“交换倾向”值。对于服务器来说，10是一个好的值：
要使交换性(swappiness)设置持久化，用你选择的编辑器打开`/etc/sysctl.conf`文件，并添加以下行：

--------
vm.swappiness = 10
--------

.Linux内核 `swappiness` 参数值
[width="100%", cols="<m,2d", options="header"]
|===========================================================
| 值                  | 策略
| vm.swappiness = 0   | 内核只会在避免“内存不足”条件下才进行交换
| vm.swappiness = 1   | 不完全禁用交换的最小数量。
| vm.swappiness = 10  | 当系统存在足够内存时，有时推荐此值以提高性能。
| vm.swappiness = 60  | 默认值。
| vm.swappiness = 100 | 内核将积极进行交换。
|===========================================================

[[zfs_encryption]]
加密的ZFS数据集
~~~~~~~~~

WARNING: '''{pve}中的原生ZFS加密目前还处于实验阶段。已知的限制和问题包括使用加密数据集进行复制时的问题footnote:[https://bugzilla.proxmox.com/show_bug.cgi?id=2350]，以及在使用快照或ZVOLs时出现的校验和错误。footnote:[https://github.com/openzfs/zfs/issues/11688]'''

ZFS在Linux版本0.8.0引入了对数据集本机加密的支持。在从先前的ZFS on Linux版本升级之后，可以按照池启用加密功能：
WARNING: 目前GRUB不支持从含有加密数据集的池中引导启动，且对于启动时自动解锁加密数据集的支持也有限。不支持加密功能的旧版本ZFS将无法解密存储的数据。

NOTE: 建议在启动后手动解锁存储数据集，或者编写一个自定义单元，在启动时将解锁所需的密钥材料传递给 `zfs load-key`。

WARNING: 在启用生产数据加密之前，建立并测试备份程序。如果相关的密钥材料/密码/密钥文件丢失，将无法再访问加密数据。

在创建数据集/zvols时需要设置加密，并且默认情况下这个设置会继承给子数据集。例如，要创建一个加密的数据集 `tank/encrypted_data` 并在 {pve} 中配置它作为存储，请运行以下命令：
在此存储上创建的所有访客卷/磁盘将使用父数据集的共享密钥材料进行加密。

要实际使用存储空间，需要加载相关的密钥材料并且挂载数据集。这可以通过以下一步完成：
也可以通过设置`keylocation`和`keyformat`属性来使用(随机的)密钥文件代替密码提示，这可以在创建时或通过`zfs change-key`在现有数据集上进行。
WARNING: 在使用密钥文件时，需要特别注意保护密钥文件不受未授权访问或意外丢失。如果没有密钥文件，将无法访问明文数据！

在加密数据集下创建的客户卷将会相应地设置其`encryptionroot`属性。密钥材料只需要为每个encryptionroot加载一次，就可以对其下所有加密数据集可用。

请参阅`encryptionroot`、`encryption`、`keylocation`、`keyformat`和`keystatus`属性，`zfs load-key`、`zfs unload-key`和`zfs change-key`命令，以及`man zfs`中的`Encryption`部分，以获取更多详细信息和高级用法。

[[zfs_compression]]
ZFS中的压缩
~~~~~~~

当在数据集上启用压缩时，ZFS会在写入之前尝试压缩所有*新*块，并在读取时解压它们。已经存在的数据不会被追溯压缩。

您可以通过以下方式启用压缩：
我们推荐使用`lz4`算法，因为它几乎不会增加CPU的负担。其他像`lzjb`和`gzip-N`的算法也是可用的，其中`N`是从`1`（最快）到`9`（最佳压缩比）的整数。根据选择的算法以及数据的可压缩性，启用压缩甚至可能提升I/O性能。

您可以随时使用以下方法禁用压缩：
再次强调，只有新的区块会受到这次变化的影响。

[[sysadmin_zfs_special_device]]
ZFS 专用设备
~~~~~~~~

自0.8.0版本起，ZFS支持`special`设备。在存储池中，`special`设备用于存储元数据、去重表格，以及可选的小文件块。

一个`特殊`设备可以提高由旋转速度慢的硬盘组成的存储池的速度，尤其是在有大量元数据变化的情况下。例如，涉及创建、更新或删除大量文件的工作负载将从`特殊`设备的存在中受益。ZFS数据集也可以配置为将所有小文件存储在`特殊`设备上，这进一步提高了性能。使用快速的SSD作为`特殊`设备。

IMPORTANT: special`设备的冗余度应该与池的冗余度相匹配，因为`special`设备是整个池的故障点。

WARNING: 向池中添加一个`特别的`设备是无法撤销的！

.创建一个带有`special`设备和RAID-1的池：
.将一个`special`设备添加到已存在的RAID-1池中：
ZFS数据集暴露了`special_small_blocks=<size>`属性。`size`可以是`0`，以禁用在`special`设备上存储小文件块，或者是在`512B`到`1M`范围内的二的幂次方。设置该属性后，小于`size`的新文件块将被分配到`special`设备上。

IMPORTANT: 如果`special_small_blocks`的值大于或等于数据集的`recordsize`（默认`128K`），*所有*数据将被写入`special`设备，所以要小心！

在池(pool)上设置`special_small_blocks`属性将改变该属性对所有子ZFS数据集的默认值（例如，池中的所有容器都将选择小文件块）。

.为所有小于4K块大小的文件选择加入到全局池中：
.为单个数据集选择启用小文件块：
.为单个数据集选择退出小文件块：
[[sysadmin_zfs_features]]
ZFS池功能
~~~~~~

在ZFS中，对磁盘格式的更改只在主要版本更迭时进行，并通过*特性*来指定。所有特性以及通用机制都在`zpool-features(5)`手册页中有详细文档说明。

由于启用新特性可能会导致池不可被旧版本的ZFS导入，因此需要管理员主动进行，通过在池上运行 `zpool upgrade` 命令（参见 `zpool-upgrade(8)` 手册页）。

除非你需要使用其中的新功能，否则启用它们没有好处。

实际上，启用新功能也有一些缺点：

* 一个使用ZFS作为根文件系统的系统，如果仍通过GRUB引导启动，并且在rpool上激活了新功能，由于GRUB中ZFS的实现不兼容，这将导致系统无法启动。
* 当系统使用一个较旧的内核启动时，它将无法导入任何升级过的存储池，因为该旧内核仍然附带旧版的ZFS模块。
* 使用较旧的{pve} ISO引导以修复一个无法启动的系统同样不会起作用。

IMPORTANT: 如果您的系统仍然使用GRUB引导，请*不要*升级您的rpool，因为这会导致您的系统无法启动。这包括在{pve} 5.4之前安装的系统，以及使用传统BIOS启动的系统（请参阅xref:sysboot_determine_bootloader_used[如何确定使用的引导加载程序]）。

.为ZFS池启用新特性：
[[chapter_btrfs]]
BTRFS
-----

WARNING: BTRFS集成目前在{pve}中是一个**技术预览**。

BTRFS 是一个现代的写时复制文件系统，由 Linux 内核原生支持，实现了如快照、内建 RAID 以及通过数据和元数据的校验和进行自我修复的功能。从 {pve} 7.0 开始，BTRFS 被引入作为根文件系统的可选项。

.BTRFS的一般优势

* 主系统设置几乎与传统基于ext4的设置相同。

* 快照

* 文件系统级别的数据压缩

* 写时复制克隆

* RAID0、RAID1和RAID10

* 数据防损坏保护

* 自愈

* 原生支持的Linux内核

* ...

.注意事项

* RAID 5/6级别是实验性的并且危险的

作为根文件系统的安装
~~~~~~~~~~

当您使用{pve}安装程序进行安装时，可以选择BTRFS作为根文件系统。您需要在安装时选择RAID类型：

[horizontal]
RAID0:: 也被称为“条带化”。这种卷的容量是所有磁盘容量的总和。但是RAID0没有增加任何冗余，因此单个驱动器的故障会导致卷不可用。

RAID1:: 也被称为“镜像”。数据会被一模一样地写入到所有磁盘中。这种模式至少需要两块相同大小的磁盘。其结果容量等同于单个磁盘的容量。

RAID10:: RAID0和RAID1的组合。至少需要4个磁盘。

安装程序会自动分区磁盘，并在 `/var/lib/pve/local-btrfs` 创建一个额外的子卷。为了能够使用 {pve} 工具，安装程序会在 `/etc/pve/storage.cfg` 中创建以下配置条目：
这显式地禁用了默认的`local`存储，以支持在额外的子卷上的BTRFS特定存储条目。

btrfs`命令用于配置和管理BTRFS文件系统，在安装后，以下命令列出所有额外的子卷：
BTRFS 管理
~~~~~~~~

这一部分为您提供了一些常见任务的使用示例。

创建一个BTRFS文件系统
^^^^^^^^^^^^^

要创建BTRFS文件系统，使用`mkfs.btrfs`命令。`-d`和`-m`参数分别用于设置元数据和数据的配置文件。可以使用可选的`-L`参数来设置标签。

通常，支持以下模式：`single`、`raid0`、`raid1`、`raid10`。

在单个磁盘`/dev/sdb`上创建一个标签为`My-Storage`的BTRFS文件系统：
或者在两个分区`/dev/sdb1`和`/dev/sdc1`上创建一个RAID1：
# mkfs.btrfs -m raid1 -d raid1 -L My-Storage /dev/sdb1 /dev/sdc1
挂载BTRFS文件系统
^^^^^^^^^^^

新的文件系统随后可以手动挂载，例如：
BTRFS也可以像任何其他挂载点一样被添加到`/etc/fstab`中，从而在启动时自动挂载。建议避免使用块设备路径，而是使用`mkfs.btrfs`命令打印的`UUID`值，尤其是在BTRFS设置中有多于一个磁盘时。

例如：

.文件 `/etc/fstab
TIP: 如果你不再拥有UUID，你可以使用`blkid`工具列出所有块设备的属性。

之后，你可以通过执行以下操作来触发第一次挂载：
在下次重启后，系统将会在启动时自动完成这项操作。

将BTRFS文件系统添加到{pve}
^^^^^^^^^^^^^^^^^^

您可以通过网络界面将一个现有的BTRFS文件系统添加到{pve}，或者使用命令行界面，例如：
创建一个子卷
^^^^^^

创建一个子卷将其链接到BTRFS文件系统中的一个路径，在那里它将显示为一个普通目录。
之后 `/some/path` 将像一个普通目录一样工作。

删除子卷
^^^^

与通过`rmdir`删除的目录不同，子卷在用`btrfs`命令删除时不需要为空。
创建一个子卷的快照
^^^^^^^^^

BTRFS实际上并不区分快照和普通子卷，所以进行快照实际上也可以被视为创建一个子卷的任意副本。按照惯例，{pve}在创建客户磁盘或子卷的快照时会使用只读标志，但这个标志后来也可以更改。
这将在`/a/new/path`的位置创建一个对`/some/path`子卷的只读"克隆"。对`/some/path`的任何未来修改在修改之前都会使被修改的数据被复制。

如果省略了只读（`-r`）选项，两个子卷都将是可写的。

启用压缩
^^^^

默认情况下，BTRFS不会压缩数据。要启用压缩，可以添加`compress`挂载选项。请注意，已经写入的数据在事后不会被压缩。

默认情况下，rootfs 将如下列在 `/etc/fstab` 文件中：
您可以简单地将 `compress=zstd`、`compress=lzo` 或 `compress=zlib` 追加到上面的 `defaults` 中，如下所示：
这个更改将在重启后生效。

检查空间使用情况
^^^^^^^^

经典的`df`工具可能会对于一些BTRFS设置输出令人困惑的数值。为了获得更好的估算，请使用`btrfs filesystem usage /PATH`命令，例如：
[[proxmox_node_management]]
Proxmox 节点管理
------------

{PVE}节点管理工具（`pvenode`）允许你控制节点特定的设置和资源。

当前，`pvenode` 允许您设置节点的描述、在节点的访客上运行各种批量操作、查看节点的任务历史记录，并通过 `pveproxy` 管理用于 API 和 web GUI 的节点 SSL 证书。

远程唤醒
~~~~
远程唤醒（Wake-on-LAN，简称WoL）允许你通过发送一个魔术包来开启网络中的休眠计算机。至少有一个网络接口卡（NIC）必须支持此功能，并且需要在计算机的固件（BIOS/UEFI）配置中启用相应选项。选项名称可能从“启用网络唤醒”变为“通过PCIE设备开机”；如果不确定，可以查看主板厂商的手册。`ethtool`可以用来检查`<interface>`的WoL配置，通过运行：
pvenode` 允许你通过 WoL 命令唤醒集群中的休眠成员：
这将在UDP端口9上广播WoL魔术包，其中包含从`wakeonlan`属性获得的`<node>`的MAC地址。可以使用以下命令设置特定于节点的`wakeonlan`属性：
通过哪个接口发送WoL数据包是通过默认路由确定的。可以通过以下命令设置`bind-interface`来覆盖它：
广播地址（默认为`255.255.255.255`）在发送WoL（唤醒局域网）数据包时可以通过使用以下命令显式设置`broadcast-address`来进行更改：
任务历史
~~~~

当排查服务器问题时，例如，失败的备份作业，通常查看之前运行任务的日志会很有帮助。使用 {pve}，你可以通过 `pvenode task` 命令访问节点的任务历史。

你可以使用`list`子命令获取节点已完成任务的过滤列表。例如，要获取与虚拟机'100'相关且以错误结束的任务列表，命令将是：
任务的日志可以通过其UPID打印出来。
批量客房电源管理
~~~~~~~~

如果你有很多虚拟机/容器，可以使用 `pvenode` 的 `startall` 和 `stopall` 子命令来批量启动和停止宾主机。默认情况下，`pvenode startall` 仅会启动在引导时设为自动启动的虚拟机/容器（参见 xref:qm_startup_and_shutdown[虚拟机的自动启动和关闭]），但是你可以使用 `--force` 标志来覆盖此行为。这两个命令还有一个 `--vms` 选项，可以限制停止/启动的宾主机到指定的 VMIDs。

例如，要启动虚拟机 '100'、'101' 和 '102'，不管它们是否设置了 `onboot`，你可以使用：
要停止这些客户端（以及可能正在运行的任何其他客户端），请使用以下命令：
NOTE: '''stopall命令首先尝试执行一个干净的关机，然后等待直到所有的客户机都成功关机或者一个可以覆盖的超时（默认为3分钟）到期为止。一旦发生这种情况，并且force-stop参数没有明确设置为0（假），所有仍在运行的虚拟客户机都将被强制停止。'''

[[first_guest_boot_delay]]
首次访客启动延迟
~~~~~~~~

如果您的虚拟机/容器依赖于启动缓慢的外部资源，例如NFS服务器，您也可以设置节点启动后和配置为自动启动的第一台虚拟机/容器启动之间的延迟时间（参见 xref:qm_startup_and_shutdown[虚拟机的自动启动和关闭]）。

你可以通过设置以下参数来实现这一点（其中`10`代表秒数延迟）：
批量客户迁移
~~~~~~

如果升级情况需要你将所有客体从一个节点迁移到另一个节点，`pvenode` 还提供了 `migrateall` 子命令用于批量迁移。默认情况下，此命令将会迁移系统上的每一个客体到目标节点。然而，它可以设置为仅迁移一组特定的客体。

例如，要将虚拟机'100'、'101'和'102'迁移到节点'pve2'，并启用本地磁盘的实时迁移，你可以运行：
// TODO: explain node shutdown (stopall is used there) and maintenance options

[[sysadmin_certificate_management]]
证书管理
pvenode acme account register account-name mail@example.com
root@proxmox:~# pvenode acme account register default mail@example.invalid
Directory endpoints:
0) Let's Encrypt V2 (https://acme-v02.api.letsencrypt.org/directory)
1) Let's Encrypt V2 Staging (https://acme-staging-v02.api.letsencrypt.org/directory)
2) Custom
Enter selection: 1

服务条款: https://letsencrypt.org/documents/LE-SA-v1.2-November-15-2017.pdf
您同意上述条款吗？[y|N]y
...
任务完成
root@proxmox:~# pvenode config set --acme domains=example.invalid
root@proxmox:~# pvenode acme cert order
加载ACME账户详细信息
下达ACME订单
...
状态为'有效'！

所有域名已验证！
...
正在下载证书
设置 pveproxy 证书和密钥
重启 pveproxy
任务完成
root@proxmox:~# cat /path/to/api-token
OVH_AK=XXXXXXXXXXXXXXXX
OVH_AS=YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY
root@proxmox:~# source /path/to/api-token
root@proxmox:~# curl -XPOST -H"X-Ovh-Application: $OVH_AK" -H "Content-type: application/json" \
https://eu.api.ovh.com/1.0/auth/credential  -d '{
  "accessRules": [
    {"method": "GET","path": "/auth/time"},
    {"method": "GET","path": "/domain"},
    {"method": "GET","path": "/domain/zone/*"},
    {"method": "GET","path": "/domain/zone/*/record"},
    {"method": "POST","path": "/domain/zone/*/record"},
    {"method": "POST","path": "/domain/zone/*/refresh"},
    {"method": "PUT","path": "/domain/zone/*/record/"},
    {"method": "DELETE","path": "/domain/zone/*/record/*"}
]
}'
{"consumerKey":"ZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZ","state":"pendingValidation","validationUrl":"https://eu.api.ovh.com/auth/?credentialToken=AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA"}

打开验证链接并按照指引将应用程序密钥与账户/消费者密钥关联起来。

root@proxmox:~# echo "OVH_CK=ZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZ" >> /path/to/api-token
root@proxmox:~# pvenode acme plugin add dns example_plugin --api ovh --data /path/to/api_token
root@proxmox:~# pvenode acme plugin config example_plugin
┌────────┬──────────────────────────────────────────┐
│ key    │ value                                    │
╞════════╪══════════════════════════════════════════╡
│ api    │ ovh                                      │
├────────┼──────────────────────────────────────────┤
│ data   │ OVH_AK=XXXXXXXXXXXXXXXX                  │
│        │ OVH_AS=YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY  │
│        │ OVH_CK=ZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZ  │
├────────┼──────────────────────────────────────────┤
│ digest │ 867fcf556363ca1bea866863093fcab83edf47a1 │
├────────┼──────────────────────────────────────────┤
│ plugin │ example_plugin                           │
├────────┼──────────────────────────────────────────┤
│ type   │ dns                                      │
└────────┴──────────────────────────────────────────┘
root@proxmox:~# pvenode config set -acmedomain0 example.proxmox.com,plugin=example_plugin
root@proxmox:~# pvenode acme cert order
Loading ACME account details
Placing ACME order
Order URL: https://acme-staging-v02.api.letsencrypt.org/acme/order/11111111/22222222

从 'https://acme-staging-v02.api.letsencrypt.org/acme/authz-v3/33333333' 获取授权详情
example.proxmox.com 的验证等待中！
[Wed Apr 22 09:25:30 CEST 2020] 使用 OVH 端点：ovh-eu
[Wed Apr 22 09:25:30 CEST 2020] 正在检查认证
[Wed Apr 22 09:25:30 CEST 2020] 消费者密钥正常。
[Wed Apr 22 09:25:31 CEST 2020] 正在添加记录
[Wed Apr 22 09:25:32 CEST 2020] 已添加，等待10秒。
添加 TXT 记录：_acme-challenge.example.proxmox.com
触发验证
等待5秒
状态为'有效'！
[Wed Apr 22 09:25:48 CEST 2020] 使用 OVH 端点：ovh-eu
[Wed Apr 22 09:25:48 CEST 2020] 正在检查认证
[Wed Apr 22 09:25:48 CEST 2020] 消费者密钥正常。
移除 TXT 记录：_acme-challenge.example.proxmox.com

所有域名已验证！

创建CSR
检查订单状态
订单已准备好，正在完成订单
有效！

下载证书
设置 pveproxy 证书和密钥
重启 pveproxy
任务完成
root@proxmox:~# pvenode acme account deactivate default
Renaming account file from '/etc/pve/priv/acme/default' to '/etc/pve/priv/acme/_deactivated_default_4'
Task OK

root@proxmox:~# pvenode acme account register default example@proxmox.com
Directory endpoints:
0) Let's Encrypt V2 (https://acme-v02.api.letsencrypt.org/directory)
1) Let's Encrypt V2 Staging (https://acme-staging-v02.api.letsencrypt.org/directory)
2) Custom
Enter selection: 0

服务条款：https://letsencrypt.org/documents/LE-SA-v1.2-November-15-2017.pdf
你同意上述条款吗？[y|N]y
...
任务完成
# proxmox-boot-tool status
# proxmox-boot-tool format /dev/sda2
# proxmox-boot-tool init /dev/sda2
# proxmox-boot-tool init /dev/sda2 grub
# proxmox-boot-tool refresh
# proxmox-boot-tool kernel add 5.0.15-1-pve
# proxmox-boot-tool kernel list
Manually selected kernels:
5.0.15-1-pve

自动选择的内核:
5.0.12-1-pve
4.15.18-18-pve
# proxmox-boot-tool kernel remove 5.0.15-1-pve
# efibootmgr -v
Boot0005* proxmox	[...] File(\EFI\proxmox\grubx64.efi)
Boot0006* Linux Boot Manager	[...] File(\EFI\systemd\systemd-bootx64.efi)
# proxmox-boot-tool status
# update-grub
title    Proxmox
version  5.0.15-1-pve
options   root=ZFS=rpool/ROOT/pve-1 boot=zfs
linux    /EFI/proxmox/5.0.15-1-pve/vmlinuz-5.0.15-1-pve
initrd   /EFI/proxmox/5.0.15-1-pve/initrd.img-5.0.15-1-pve
# uname -r
# proxmox-boot-tool kernel pin 5.15.30-1-pve
# proxmox-boot-tool kernel pin 5.15.30-1-pve --next-boot
# proxmox-boot-tool kernel unpin
# proxmox-boot-tool refresh
# findmnt /
TARGET SOURCE           FSTYPE OPTIONS
/      rpool/ROOT/pve-1 zfs    rw,relatime,xattr,noacl,casesensitive
# lsblk -o +FSTYPE
NAME   MAJ:MIN RM  SIZE RO TYPE MOUNTPOINTS FSTYPE
sda      8:0    0   32G  0 disk
├─sda1   8:1    0 1007K  0 part
├─sda2   8:2    0  512M  0 part             vfat
└─sda3   8:3    0 31.5G  0 part             zfs_member
sdb      8:16   0   32G  0 disk
├─sdb1   8:17   0 1007K  0 part
├─sdb2   8:18   0  512M  0 part             vfat
└─sdb3   8:19   0 31.5G  0 part             zfs_member
# proxmox-boot-tool init /dev/sda2 grub
# efibootmgr -v
[..]
Boot0009* proxmox       HD(2,GPT,..,0x800,0x100000)/File(\EFI\proxmox\shimx64.efi)
[..]
# openssl x509 -in /var/lib/dkms/mok.pub -noout -text
# mokutil --import /var/lib/dkms/mok.pub
input password:
input password again:
# systemctl status ksmtuned
# systemctl disable --now ksmtuned
# echo 2 > /sys/kernel/mm/ksm/run
# qm set ID --tags myfirsttag;mysecondtag
# pvesh set /cluster/options --tag-style color-map=example:000000:FFFFFF
hp1# pvecm create CLUSTERNAME
hp1# pvecm status
# pvecm add IP-ADDRESS-CLUSTER
# pvecm status
# pvecm status
Cluster information
~~~~~~~~~~~~~~~~~~~
Name:             prod-central
Config Version:   3
Transport:        knet
Secure auth:      on

Quorum information
~~~~~~~~~~~~~~~~~~
日期：             2021年9月14日 星期二 11:06:47
Quorum 提供者：   corosync_votequorum
节点数量：         4
节点 ID：         0x00000001
环 ID：           1.1a8
是否形成仲裁：    是

投票法定人数信息
~~~~~~~~~~~~~~~~~~~~~~
预期投票数：4
最高预期：4
总投票数：4
法定人数：3
标志：达到法定人数

Membership information
~~~~~~~~~~~~~~~~~~~~~~
    Nodeid      Votes Name
0x00000001          1 192.168.15.91
0x00000002          1 192.168.15.92 (local)
0x00000003          1 192.168.15.93
0x00000004          1 192.168.15.94
# pvecm nodes
# pvecm nodes

成员资料
~~~~~~~~~~~~~~~~~~~~~~
    节点编号      投票数 名称
         1          1 hp1
         2          1 hp2 (本地)
         3          1 hp3
         4          1 hp4
# pvecm add IP-ADDRESS-CLUSTER --link0 LOCAL-IP-ADDRESS-LINK0
hp1# pvecm nodes

会员信息
~~~~~~~~~~~~~~~~~~~~~~
    节点ID      投票数 名称
         1          1 hp1 (本地)
         2          1 hp2
         3          1 hp3
         4          1 hp4
hp1# pvecm delnode hp4
Killing node 4
hp1# pvecm status

您需要提供要翻译的内容，才能进行翻译。

投票法定人数信息
~~~~~~~~~~~~~~~~~~~~~~
预期票数：       3
最高预期票数：   3
总票数：         3
法定人数：       2
标志：           达到法定人数

Membership information
~~~~~~~~~~~~~~~~~~~~~~
    Nodeid      Votes Name
0x00000001          1 192.168.15.90 (local)
0x00000002          1 192.168.15.91
0x00000003          1 192.168.15.92
systemctl stop pve-cluster
systemctl stop corosync
pmxcfs -l
rm /etc/pve/corosync.conf
rm -r /etc/corosync/*
killall pmxcfs
systemctl start pve-cluster
pvecm delnode oldnode
预期为1
rm /var/lib/corosync/*
pvecm create test --link0 10.10.10.1
systemctl status corosync
logging {
  debug: off
  to_syslog: yes
}

nodelist {

'''
  node {
    name: due
    nodeid: 2
    quorum_votes: 1
    ring0_addr: due
  }
'''

node {
    name: tre
    nodeid: 3
    quorum_votes: 1
    ring0_addr: tre
  }

node {
    name: uno
    nodeid: 1
    quorum_votes: 1
    ring0_addr: uno
  }

}

quorum {
  provider: corosync_votequorum
}

totem {
  cluster_name: testcluster
  config_version: 3
  ip_version: ipv4-6
  secauth: on
  version: 2
  interface {
    linknumber: 0
  }

}
logging {
  debug: off
  to_syslog: yes
}

nodelist {

node {
    name: due
    nodeid: 2
    quorum_votes: 1
    ring0_addr: 10.10.10.2
  }

node {
    name: tre
    nodeid: 3
    quorum_votes: 1
    ring0_addr: 10.10.10.3
  }

  node {
    name: uno
    nodeid: 1
    quorum_votes: 1
    ring0_addr: 10.10.10.1
  }

}

quorum {
  provider: corosync_votequorum
}

totem {
  cluster_name: testcluster
  config_version: 4
  ip_version: ipv4-6
  secauth: on
  version: 2
  interface {
    linknumber: 0
  }

}
systemctl restart corosync
systemctl status corosync
 # pvecm create CLUSTERNAME --link0 10.10.10.1,priority=15 --link1 10.20.20.1,priority=20
logging {
  debug: off
  to_syslog: yes
}

nodelist {

node {
    name: due
    nodeid: 2
    quorum_votes: 1
    ring0_addr: 10.10.10.2
    ring1_addr: 10.20.20.2
  }

  node {
    name: tre
    nodeid: 3
    quorum_votes: 1
    ring0_addr: 10.10.10.3
    ring1_addr: 10.20.20.3
  }

node {
    name: uno
    nodeid: 1
    quorum_votes: 1
    ring0_addr: 10.10.10.1
    ring1_addr: 10.20.20.1
  }

}

quorum {
  provider: corosync_votequorum
}

totem {
  cluster_name: testcluster
  config_version: 4
  ip_version: ipv4-6
  secauth: on
  version: 2
  interface {
    linknumber: 0
  }
  interface {
    linknumber: 1
  }
}
journalctl -b -u corosync
pvecm状态
# Early exit if not running interactively to avoid side-effects!
case $- in
    *i*) ;;
      *) return;;
esac
external# apt install corosync-qnetd
pve# apt install corosync-qdevice
pve# pvecm qdevice setup <QDEVICE-IP>
pve# pvecm status

您需要提供要翻译的内容，才能进行翻译。

投票仲裁信息
~~~~~~~~~~~~~~~~~~~~~
预期投票数：3
最高预期：3
总投票数：3
法定人数：2
标志：已达法定人数 Q设备

会员信息
~~~~~~~~~~~~~~~~~~~~~~
    节点ID      票数    Q设备 名称
    0x00000001      1    A,V,NMW 192.168.22.180 (本地)
    0x00000002      1    A,V,NMW 192.168.22.181
    0x00000000      1            Q设备
pve# pvecm qdevice remove
man corosync.conf
cp /etc/pve/corosync.conf /etc/pve/corosync.conf.new
cp /etc/pve/corosync.conf /etc/pve/corosync.conf.bak
mv /etc/pve/corosync.conf.new /etc/pve/corosync.conf
systemctl status corosync
journalctl -b -u corosync
systemctl restart corosync
[...]
corosync[1647]:  [QUORUM] Quorum provider: corosync_votequorum初始化失败。
corosync[1647]:  [SERV  ] 服务引擎'corosync_quorum'加载失败，原因是
    '配置错误：必须配置nodelist或quorum.expected_votes！'
[...]
预期为1
iface eno1 inet manual

# public network
auto vmbr0
iface vmbr0 inet static
    address 192.X.Y.57/24
    gateway 192.X.Y.1
    bridge-ports eno1
    bridge-stp off
    bridge-fd 0

# cluster network
auto eno2
iface eno2 inet static
    address  10.1.1.1/24

# fast network
auto eno3
iface eno3 inet static
    address  10.1.2.1/24
# qm migrate 106 tre --online --migration_network 10.1.2.0/24
# 使用专用迁移网络
迁移：安全,网络=10.1.2.0/24
<type>: <STORAGE_ID>
	<property> <value>
	<property> <value>
	<property>
	...
dir: local
	path /var/lib/vz
	content iso,vztmpl,backup

# default image store on LVM based installation
lvmthin: local-lvm
	thinpool data
	vgname pve
	content rootdir,images

# default image store on ZFS based installation
zfspool: local-zfs
	pool rpool/data
	sparse
	content images,rootdir
dir: backup
path /mnt/backup
content backup
prune-backups keep-last=7
max-protected-backups 3
content-dirs backup=custom/backup/dir
Formatting '/var/lib/vz/images/100/vm-100-disk10.raw', fmt=raw size=4294967296
successfully created 'local:100/vm-100-disk10.raw'
# pvesm free local:100/vm-100-disk10.raw
nfs: iso-templates
    path /mnt/pve/iso-templates
    server 10.0.0.10
    export /space/iso-templates
    options vers=3,soft
    content iso,vztmpl
cifs: backup
	path /mnt/pve/backup
	server 10.0.0.11
	share VMData
	content backup
	options noserverino,echo_interval=30
	username anna
	smbversion 3
	subdir /data
# pvesm scan cifs <server> [--username <username>] [--password]
# pvesm add cifs <storagename> --server <server> --share <share> [--username <username>] [--password]
pbs: backup
datastore main
server enya.proxmox.com
content backup
fingerprint 09:54:ef:..snip..:88:af:47:fe:4c:3b:cf:8b:26:88:0b:4e:3c:b2
prune-backups keep-all=1
username archiver@pbs
# proxmox-backup-client key paperkey /etc/pve/priv/storage/<STORAGE-ID>.enc --output-format text > qrkey.txt
# pvesm add pbs <id> --server <server> --datastore <datastore> --username <username> --fingerprint 00:B4:... --password
glusterfs: Gluster
        server 10.2.3.4
        server2 10.2.3.5
	volume glustervol
	content images,iso
zfspool: vmdata
        pool tank/vmdata
        content rootdir,images
        sparse
vm-<VMID>-<NAME>      // 普通虚拟机镜像
base-<VMID>-<NAME>    // 模板虚拟机镜像（只读）
subvol-<VMID>-<NAME>  // 子卷 (ZFS 文件系统用于容器)
# zfs create tank/vmdata
lvm: myspace
	vgname myspace
	content rootdir,images
lvcreate -L 100G -n data pve
lvconvert --type thin-pool pve/data
lvmthin: local-lvm
	thinpool data
	vgname pve
	content rootdir,images
iscsi: mynas
     portal 10.10.10.1
     target iqn.2006-01.openfiler.com:tsn.dcb5aaaddd
     content none
iscsidirect: faststore
     portal 10.10.10.1
     target iqn.2006-01.openfiler.com:tsn.dcb5aaaddd
rbd: ceph-external
        monhost 10.1.1.20 10.1.1.21 10.1.1.22
        pool ceph-external
        content images
        username admin
# scp <external cephserver>:/etc/ceph/ceph.client.admin.keyring /root/rbd.keyring
# pvesm add rbd <name> --monhost "10.1.1.20 10.1.1.21 10.1.1.22" --content images --keyring /root/rbd.keyring
# /etc/pve/priv/ceph/<STORAGE_ID>.keyring
# /etc/pve/priv/ceph/<STORAGE_ID>.conf
cephfs: cephfs-external
monhost 10.1.1.20 10.1.1.21 10.1.1.22
path /mnt/pve/cephfs-external
content backup
username admin
fs-name cephfs
# scp <external cephserver>:/etc/ceph/cephfs.secret /root/cephfs.secret
# pvesm add cephfs <name> --monhost "10.1.1.20 10.1.1.21 10.1.1.22" --content backup --keyring /root/cephfs.secret
# /etc/pve/priv/ceph/<STORAGE_ID>.secret
# ceph auth get-key client.userid > cephfs.secret
btrfs: data2
path /mnt/data2/pve-storage
content rootdir,images
is_mountpoint /mnt/data2
mkdir /etc/pve/priv/zfs
ssh-keygen -f /etc/pve/priv/zfs/192.0.2.1_id_rsa
ssh-copy-id -i /etc/pve/priv/zfs/192.0.2.1_id_rsa.pub root@192.0.2.1
ssh -i /etc/pve/priv/zfs/192.0.2.1_id_rsa root@192.0.2.1
zfs: lio
   blocksize 4k
   iscsiprovider LIO
   pool tank
   portal 192.0.2.111
   target iqn.2003-01.org.linux-iscsi.lio.x8664:sn.xxxxxxxxxxxx
   content images
   lio_tpg tpg1
   sparse 1

zfs: solaris
   blocksize 4k
   target iqn.2010-08.org.illumos:02:xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx:tank1
   pool tank
   iscsiprovider comstar
   portal 192.0.2.112
   content images

zfs: freebsd
   blocksize 4k
   target iqn.2007-09.jp.ne.peach.istgt:tank1
   pool tank
   iscsiprovider istgt
   portal 192.0.2.113
   content images

zfs: iet
   blocksize 4k
   target iqn.2001-04.com.example:tank1
   pool tank
   iscsiprovider iet
   portal 192.0.2.114
   content images
pveceph 安装
pveceph init --network 10.10.10.0/24
pveceph mon create
pveceph mon destroy
pveceph mgr create
pveceph mgr destroy
pveceph osd create /dev/sd[X]
ceph-volume lvm zap /dev/sd[X] --destroy
pveceph osd create /dev/sd[X]
pveceph osd create /dev/sd[X] -db_dev /dev/sd[Y] -wal_dev /dev/sd[Z]
ceph-volume lvm create --filestore --data /dev/sd[X] --journal /dev/sd[Y]
ceph osd out <ID>
systemctl stop ceph-osd@<ID>.service
pveceph osd destroy <ID>
pveceph pool create <pool-name> --add_storages
pveceph pool create <pool-name> --erasure-coding k=2,m=1
pveceph pool create <pool-name> --erasure-coding profile=<profile-name>
pvesm add rbd <storage-name> --pool <replicated-pool> --data-pool <ec-pool>
pveceph pool destroy <name>
ceph mgr module enable pg_autoscaler
ceph osd crush tree --show-shadow
ID CLASS WEIGHT TYPE NAME
-16 nvme 2.18307 root default~nvme
-13 nvme 0.72769 host sumi1~nvme
12 nvme 0.72769 osd.12
-14 nvme 0.72769 host sumi2~nvme
13 nvme 0.72769 osd.13
-15 nvme 0.72769 host sumi3~nvme
14 nvme 0.72769 osd.14
-1 7.70544 root default
-3 2.56848 host sumi1
12 nvme 0.72769 osd.12
-5 2.56848 host sumi2
13 nvme 0.72769 osd.13
-7 2.56848 host sumi3
14 nvme 0.72769 osd.14
ceph osd crush rule create-replicated <rule-name> <root> <failure-domain> <class>
ceph osd pool set <pool-name> crush_rule <rule-name>
mkdir /etc/pve/priv/ceph
cp /etc/ceph/ceph.client.admin.keyring /etc/pve/priv/ceph/my-ceph-storage.keyring
pveceph mds create
mds standby replay = true
pveceph fs create --pg_num 128 --add-storage
umount /mnt/pve/<STORAGE-NAME>
pveceph stop --service mds.NAME
pveceph mds destroy NAME
pveceph fs destroy NAME --remove-storages --remove-pools
ceph osd out osd.<id>
ceph osd safe-to-destroy osd.<id>
systemctl stop ceph-osd@<id>.service
pveceph osd destroy <id>
# single time output
pve# ceph -s
# continuously output status changes (press CTRL+C to stop)
pve# ceph -w
# pvecm status
# pvecm expected 1
# mv /etc/pve/nodes/A/qemu-server/100.conf /etc/pve/nodes/B/qemu-server/100.conf
# mv /etc/pve/nodes/A/lxc/200.conf /etc/pve/nodes/B/lxc/200.conf
# qm start 100
# pct start 200
# pvesr create-local-job 100-0 pve1 --schedule "*/5" --rate 10
# pvesr disable 100-0
# pvesr enable 100-0
# pvesr update 100-0 --schedule '*/00'
for f in /sys/devices/system/cpu/vulnerabilities/*; do echo "${f##*/} -" $(cat "$f"); done
# grep ' pcid ' /proc/cpuinfo
SUBSYSTEM=="cpu", ACTION=="add", TEST=="online", ATTR{online}=="0", ATTR{online}="1"
# qm set <vmid> -vga <displaytype>,clipboard=vnc
# qm set <vmid> -efidisk0 <storage>:1,format=<format>,efitype=4m,pre-enrolled-keys=1
# qm set <vmid> -tpmstate0 <storage>:1,version=<version>
# qm set <vmid> -ivshmem size=32,name=foo
qm set <vmid> -audio0 device=<device>
qm set <vmid> -rng0 source=<source>[,max_bytes=X,period=Y]
boot: order=scsi0;net0;hostpci0
# qm set <vmid> -onboot 1
qm set <vmid> -spice_enhancements foldersharing=1,videostreaming=all
# qm migrate <vmid> <target>
# qm set VMID -vmgenid 1
# qm set VMID -vmgenid 00000000-0000-0000-0000-000000000000
# qm set VMID -delete vmgenid
# qm importovf 999 WinDev1709Eval.ovf local-lvm
# qm create 600 --net0 virtio,bridge=vmbr0 --name vm600 --serial0 socket \
   --boot order=scsi0 --scsihw virtio-scsi-pci --ostype l26 \
   --scsi0 pvedir:0,import-from=/path/to/dir/vm600.raw
apt-get install cloud-init
# download the image
wget https://cloud-images.ubuntu.com/bionic/current/bionic-server-cloudimg-amd64.img

# create a new VM with VirtIO SCSI controller
qm create 9000 --memory 2048 --net0 virtio,bridge=vmbr0 --scsihw virtio-scsi-pci

# import the downloaded disk to the local-lvm storage, attaching it as a SCSI drive
qm set 9000 --scsi0 local-lvm:0,import-from=/path/to/bionic-server-cloudimg-amd64.img
qm set 9000 --ide2 local-lvm:cloudinit
qm set 9000 --boot order=scsi0
qm set 9000 --serial0 socket --vga serial0
qm模版 9000
qm clone 9000 123 --name ubuntu2
qm set 123 --sshkey ~/.ssh/id_rsa.pub
qm set 123 --ipconfig0 ip=10.0.10.123/24,gw=10.0.10.1
qm set 9000 --cicustom "user=<volume>,network=<volume>,meta=<volume>"
qm set 9000 --cicustom "user=local:snippets/userconfig.yaml"
qm cloudinit dump 9000 user
 lspci
intel_iommu=on
iommu=pt
vfio
vfio_iommu_type1
vfio_pci
vfio_virqfd #如果是6.2或更高版本的内核，就不需要了
# update-initramfs -u -k all
# lsmod | grep vfio
# dmesg | grep -e DMAR -e IOMMU -e AMD-Vi
# pvesh get /nodes/{nodename}/hardware/pci --pci-class-blacklist ""
options vfio_iommu_type1 allow_unsafe_interrupts=1
options vfio-pci ids=1234:5678,4321:8765
# lspci -nn
将 DRIVERNAME 添加到黑名单
# lspci -k
# lspci -k | grep -A 3 "VGA"
01:00.0 VGA兼容控制器：NVIDIA Corporation GP108 [GeForce GT 1030] (rev a1)
	子系统：Micro-Star International Co., Ltd. [MSI] GP108 [GeForce GT 1030]
	正在使用的内核驱动：<some-module>
	内核模块：<some-module>
echo "blacklist <some-module>" >> /etc/modprobe.d/blacklist.conf
# echo "softdep <some-module> pre: vfio-pci" >> /etc/modprobe.d/<some-module>.conf
# lspci -nnk
正在使用的内核驱动程序：vfio-pci
echo "options vfio-pci ids=<vendor-id>,<device-id> disable_vga=1" > /etc/modprobe.d/vfio.conf
# lspci -nn
# qm set VMID -hostpci0 00:02.0
hostpci0: 00:02.0
# qm set VMID -hostpci0 02:00,pcie=on,x-vga=on
# qm set VMID -hostpci0 02:00,device-id=0x10f6,sub-vendor-id=0x0000
max_vfs=4
# echo 4 > /sys/bus/pci/devices/0000:01:00.0/sriov_numvfs
i915.enable_gvt=1
# ls /sys/bus/pci/devices/0000:00:02.0/mdev_supported_types
# qm set VMID -hostpci0 00:02.0,mdev=i915-GVTg_V5_4
# qm set 100 --hookscript local:snippets/hookscript.pl
# qm suspend ID --todisk
# pvesh create /cluster/mapping/<type> <options>
# pvesh create /cluster/mapping/pci --id device1 \
 --map node=node1,path=0000:01:00.0,id=0002:0001 \
 --map node=node2,path=0000:02:00.0,id=0002:0001
# qm set ID -hostpci0 <name>
# qm set <vmid> -usb0 <name>
# qm create 300 -ide0 local-lvm:4 -net0 e1000 -cdrom local:iso/proxmox-mailgateway_2.1.iso
# qm start 300
# qm shutdown 300 && qm wait 300
# qm shutdown 300 && qm wait 300 -timeout 40
# qm destroy 300 --purge
# qm move-disk 300 scsi0 other-storage
# qm move-disk 300 scsi1 --target-vmid 400 --target-disk scsi3
boot: order=virtio0;net0
cores: 1
sockets: 1
memory: 512
name: webmail
ostype: l26
net0: e1000=EE:D2:28:5F:B6:3E,bridge=vmbr0
virtio0: local:vm-100-disk-1,size=32G
# this is a comment
OPTION: value
memory: 512
swap: 512
parent: testsnaphot
...

[testsnaphot]
memory: 512
swap: 512
snaptime: 1457170803
...
# qm unlock <vmid>
# pveam update
# pveam available
# pveam available --section system
system          alpine-3.12-default_20200823_amd64.tar.xz
system          alpine-3.13-default_20210419_amd64.tar.xz
system          alpine-3.14-default_20210623_amd64.tar.xz
system          archlinux-base_20210420-1_amd64.tar.gz
system          centos-7-default_20190926_amd64.tar.xz
system          centos-8-default_20201210_amd64.tar.xz
system          debian-9.0-standard_9.7-1_amd64.tar.gz
system          debian-10-standard_10.7-1_amd64.tar.gz
system          devuan-3.0-standard_3.0_amd64.tar.gz
system          fedora-33-default_20201115_amd64.tar.xz
system          fedora-34-default_20210427_amd64.tar.xz
system          gentoo-current-default_20200310_amd64.tar.xz
system          opensuse-15.2-default_20200824_amd64.tar.xz
system          ubuntu-16.04-standard_16.04.5-1_amd64.tar.gz
system          ubuntu-18.04-standard_18.04.1-1_amd64.tar.gz
system          ubuntu-20.04-standard_20.04-1_amd64.tar.gz
system          ubuntu-20.10-standard_20.10-1_amd64.tar.gz
system          ubuntu-21.04-standard_21.04-1_amd64.tar.gz
# pveam download local debian-10.0-standard_10.0-1_amd64.tar.gz
# pveam list local
local:vztmpl/debian-10.0-standard_10.0-1_amd64.tar.gz  219.95MB
# pct create 999 local:vztmpl/debian-10.0-standard_10.0-1_amd64.tar.gz
# pveam remove local:vztmpl/debian-10.0-standard_10.0-1_amd64.tar.gz
# pct cpusets
 ---------------------
 102:              6 7
 105:      2 3 4 5
 108:  0 1
 ---------------------
cores: 2
cpulimit: 0.5
rootfs: thin1:base-100-disk-1,size=8G
pct set 100 -mp0 thin1:10,mp=/path/in/container
mp0: /mnt/bindmounts/shared,mp=/shared
pct set 100 -mp0 /mnt/bindmounts/shared,mp=/shared
# pct set CTID -onboot 1
# pct set 100 -hookscript local:snippets/hookscript.pl
# dmesg | grep apparmor
lxc.apparmor.profile = unconfined
systemd.unified_cgroup_hierarchy=0
# --- BEGIN PVE ---
<data>
# --- END PVE ---
# touch /etc/.pve-ignore.hosts
# quotacheck -cmug /
# quotaon /
mp0: guests:subvol-100-disk-1,mp=/root/files,size=8G
mp0: guests:subvol-100-disk-1,mp=/root/files,size=8G,backup=1
# pct create 100 /var/lib/vz/template/cache/debian-10.0-standard_10.0-1_amd64.tar.gz
# pct start 100
# pct console 100
# pct enter 100
# pct config 100
# pct set 100 -net0 name=eth0,bridge=vmbr0,ip=192.168.15.147/24,gw=192.168.15.1
# pct set 100 -memory 512
# pct destroy 100 --purge
# pct move-volume 100 mp0 other-storage
#  pct move-volume 100 mp0 --target-vmid 200 --target-volume mp1
# pct start CTID --debug
# lxc-start -n CTID -F -l DEBUG -o /tmp/lxc-CTID.log
# pct migrate <ctid> <target>
ostype: debian
arch: amd64
hostname: www
memory: 512
swap: 512
net0: bridge=vmbr0,hwaddr=66:64:66:64:64:36,ip=dhcp,name=eth0,type=veth
rootfs: local:107/vm-107-disk-1.raw,size=7G
# this is a comment
OPTION: value
lxc.init_cmd: /sbin/my_own_init
lxc.init_cmd = /sbin/my_own_init
memory: 512
swap: 512
parent: testsnaphot
...

[testsnaphot]
memory: 512
swap: 512
snaptime: 1457170803
...
# pct unlock <CTID>
apt update
apt install libpve-network-perl
source /etc/network/interfaces.d/*
apt update
apt install dnsmasq
# disable default instance
systemctl disable --now dnsmasq
apt update
apt install frr-pythontools
apt install frr frr-pythontools
api=yes
api-key=arandomgeneratedstring
webserver=yes
webserver-port=8081
{pve} SDN中的DHCP插件可用于自动部署区域的DHCP服务器。它为配置了DHCP范围的区域中的所有子网提供DHCP服务。目前，唯一可用的DHCP后端插件是dnsmasq插件。

DHCP插件的工作原理是在向VM/CT添加新的网络接口时，在配置在区域内的IPAM插件中分配一个IP。您可以在我们文档中的xref:pvesdn_config_ipam[相应章节]找到有关如何配置IPAM的更多信息。

当虚拟机启动时，MAC地址和IP的映射会在区域的DHCP插件中创建。当网络接口被移除或虚拟机/容器技术被销毁时，IP地址管理系统中的条目和DHCP服务器中的条目也会随之删除。

注意：某些功能（添加/编辑/删除IP映射）目前仅在使用xref:pvesdn_ipam_plugin_pveipam[PVE IPAM插件]时可用。

配置
~~~~~~~~~~~~~

您可以通过Web界面中的区域面板为某个区域启用自动DHCP，在区域的高级选项中启用DHCP。

注意：目前只有简单区域支持自动DHCP

在为一个区域启用了自动DHCP之后，需要为该区域中的子网配置DHCP范围。为此，请转到Vnets面板并选择您想要为其配置DHCP范围的子网。在编辑对话框中，您可以在相应的标签页中配置DHCP范围。或者，您还可以通过以下CLI命令为子网设置DHCP范围：

----
pvesh set /cluster/sdn/vnets/<vnet>/subnets/<subnet>
 -dhcp-range start-address=10.0.1.100,end-address=10.0.1.200
 -dhcp-range start-address=10.0.2.100,end-address=10.0.2.200
----

你的子网还需要配置一个网关，否则自动的DHCP将无法工作。

DHCP插件将只在配置的范围内在IPAM中分配IP地址。

不要忘记也跟随安装步骤来安装 xref:pvesdn_install_dhcp_ipam[dnsmasq DHCP 插件]。

插件
~~~~~~~

Dnsmasq 插件
^^^^^^^^^^^^^^
目前这是唯一的DHCP插件，因此当你为某个区域启用DHCP时，就会使用这个插件。

安装
有关安装，请参阅xref:pvesdn_install_dhcp_ipam[DHCP IPAM]部分。

.Configuration
插件将为dnsmasq部署到的每个区域创建一个新的systemd服务。服务的名称为`dnsmasq@<zone>`。这项服务的生命周期由DHCP插件管理。

该插件会自动在`/etc/dnsmasq.d/<zone>`文件夹中生成以下配置文件：

00-default.conf`文件：
这包含了dnsmasq实例的默认全局配置。

10-<zone>-<subnet_cidr>.conf`文件用于配置子网的特定选项，比如应该通过DHCP配置的DNS服务器。

10-<zone>-<subnet_cidr>.ranges.conf`::
该文件用于为dnsmasq实例配置DHCP范围。

ethers`::
这个文件包含了IPAM插件的MAC地址和IP映射。为了覆盖这些映射，请使用相应的IPAM插件，而不是编辑这个文件，因为它会被dnsmasq插件覆盖。

你不能编辑上述任何文件，因为它们是由 DHCP 插件管理的。为了自定义 dnsmasq 配置，你可以在配置文件夹中创建额外的文件（例如 `90-custom.conf`） - 这些文件不会被 dnsmasq DHCP 插件更改。

配置文件按顺序读取，因此你可以通过适当命名你的自定义配置文件来控制配置指令的顺序。

DHCP 租约存储在文件 `/var/lib/misc/dnsmasq.<zone>.leases` 中。

当使用 PVE IPAM 插件时，您可以更新、创建和删除 DHCP 租约。
有关更多信息，请参阅
xref:pvesdn_ipam_plugin_pveipam[the PVE IPAM 插件] 的文档。目前不支持更改其他 IPAM 插件的 DHCP 租约。

[[pvesdn_setup_examples]]
示例
--------

本节提供了针对常见SDN用例的多个配置示例。其目的是提供实际的实施方案，提供额外的细节以加深对可用配置选项的理解。

[[pvesdn_setup_example_simple]]
简单区域示例
~~~~~~

简单区域网络创建了一个隔离的网络，供单个主机上的客人相互连接。

TIP: 如果所有客户都驻留在同一主机上，则宾客之间的连接是可能的，但无法在其他节点上达到。

* 创建一个名为`simple`的简单区域。
* 添加一个名为`vnet1`的虚拟网络。
* 创建一个带有网关的子网，并启用SNAT选项。
* 这会在节点上创建一个名为 `vnet1` 的网络桥接。将这个桥接分配给需要加入网络的客户端，并配置一个IP地址。

两个虚拟机中的网络接口配置可能如下，这允许它们通过10.0.1.0/24网络进行通信。

----
allow-hotplug ens19
iface ens19 inet static
	address 10.0.1.14/24
----

----
allow-hotplug ens19
iface ens19 inet static
    address 10.0.1.15/24
----

[[pvesdn_setup_example_nat]]
源NAT示例
~~~~~~

如果你想允许在简单网络区域内的访客进行外部连接，简单区域提供了一个源网络地址转换（SNAT）选项。

从上述配置xref:pvesdn_setup_example_simple开始，向VNet `vnet1`添加一个子网，设置一个网关IP，并启用SNAT选项。

----
子网：172.16.0.0/24
网关：172.16.0.1
源地址转换(SNAT)：已勾选
----

在客人中配置子网IP范围内的静态IP地址。

节点本身将使用网关IP '172.16.0.1' 加入此网络，并将作为位于子网范围内的访客的NAT网关功能。

[[pvesdn_setup_example_vlan]]
VLAN设置示例
~~~~~~~~

当不同节点上的虚拟机需要通过隔离的网络进行通信时，VLAN 区域允许使用 VLAN 标签进行网络级别的隔离。

创建一个名为`myvlanzone`的VLAN区域：

----
ID: myvlanzone
Bridge: vmbr0
----

创建一个名为`myvnet1`的VNet，其VLAN标签为10，并使用之前创建的`myvlanzone`。

----
ID: myvnet1
区域: myvlanzone
标签: 10
----

通过主SDN面板应用配置，在每个节点上本地创建VNet。

在节点node1上创建一个基于Debian的虚拟机（'vm1'），其虚拟网络接口连接到`myvnet1`。

为此虚拟机使用以下网络配置：

----
auto eth0
iface eth0 inet static
	address 10.0.3.100/24
----

在node2上创建第二台虚拟机（'vm2'），并在与vm1相同的虚拟网络`myvnet1`上配置一个虚拟网络接口。

为此虚拟机使用以下网络配置：

----
auto eth0
iface eth0 inet static
	address 10.0.3.101/24
----

在此之后，您应该能够使用那个网络在两个虚拟机之间进行ping操作。

[[pvesdn_setup_example_qinq]]
QinQ设置示例
~~~~~~~~

这个例子配置了两个QinQ区域，并且每个区域都加入了两个虚拟机，以此来展示额外一层的VLAN标签如何允许配置更多隔离的VLAN。

这种配置的典型用途是，托管服务提供商为客户提供一个隔离的网络以实现虚拟机之间的通信，但同时隔离了不同客户之间的虚拟机。

创建一个名为`qinqzone1`的QinQ区域，服务VLAN为20

----
ID: qinqzone1
Bridge: vmbr0
Service VLAN: 20
----

创建另一个名为`qinqzone2`的QinQ区域，其服务VLAN为30
----
ID：qinqzone2
桥接器：vmbr0
服务VLAN：30
----

在之前创建的`qinqzone1`区域上创建一个名为`myvnet1`的VNet，并设置VLAN-ID为100。

----
ID: qinqvnet1
Zone: qinqzone1
Tag: 100
----

在`qinqzone2`区域创建一个带有VLAN-ID 100的`myvnet2`。

----
ID: qinqvnet2
Zone: qinqzone2
Tag: 100
----

在主SDN网络接口面板上应用配置，在每个节点本地创建VNet。

创建四个基于Debian的虚拟机（vm1、vm2、vm3、vm4），并为vm1和vm2添加桥接`qinqvnet1`的网络接口，为vm3和vm4添加桥接`qinqvnet2`的网络接口。

在虚拟机内部，配置接口的IP地址，例如通过`/etc/network/interfaces`：

----
auto eth0
iface eth0 inet static
	address 10.0.3.101/24
----
// TODO: systemd-network example
将所有四个虚拟机的IP地址配置为从'10.0.3.101'到'10.0.3.104'的范围内。

现在你应该可以在虚拟机'vm1'和'vm2'之间，以及'vm3'和'vm4'之间进行ping通信。然而，任何一个'vm1'或'vm2'的虚拟机都不能ping通'vm3'或'vm4'，因为它们位于不同的区域且拥有不同的服务VLAN。

[[pvesdn_setup_example_vxlan]]
VXLAN设置示例
~~~~~~~~~

该示例假设一个有三个节点的集群，节点的IP地址分别是192.168.0.1、192.168.0.2和192.168.0.3。

创建一个名为`myvxlanzone`的VXLAN区域，并将所有节点的IP地址添加到对等地址列表中。使用默认的MTU 1450，或者相应地进行配置。

----
ID: myvxlanzone
对等方地址列表: 192.168.0.1,192.168.0.2,192.168.0.3
----

创建一个名为 `vxvnet1` 的VNet，使用之前创建的VXLAN区域 `myvxlanzone`。

----
ID: vxvnet1
Zone: myvxlanzone
Tag: 100000
----

在主SDN网络接口面板上应用配置，以在每个节点上本地创建VNet。

在node1上创建一个基于Debian的虚拟机（'vm1'），并配有一个位于`vxvnet1`上的虚拟网卡（vNIC）。

请为这个虚拟机使用以下网络配置（注意较低的MTU）。

----
auto eth0
iface eth0 inet static
	address 10.0.3.100/24
	mtu 1450
----

在node3上创建第二个虚拟机（'vm2'），并使其虚拟网卡位于与vm1相同的虚拟网络`vxvnet1`上。

为此虚拟机使用以下网络配置：

----
auto eth0
iface eth0 inet static
	address 10.0.3.101/24
	mtu 1450
----

那么，你应该能够在'vm1'和'vm2'之间进行ping通。

[[pvesdn_setup_example_evpn]]
EVPN设置示例
~~~~~~~~

这个例子假设了一个具有三个节点（node1, node2, node3）的集群，其IP地址分别为192.168.0.1, 192.168.0.2和192.168.0.3.

创建一个EVPN控制器，使用一个私有ASN号码，并将上述节点地址作为对等体。

----
ID: myevpnctl
ASN#: 65000
Peers: 192.168.0.1,192.168.0.2,192.168.0.3
----

创建一个名为`myevpnzone`的EVPN区域，分配之前创建的EVPN控制器，并定义'node1'和'node2'为出口节点。

----
ID: myevpnzone
VRF VXLAN标签: 10000
控制器: myevpnctl
MTU: 1450
VNet MAC地址: 32:F4:05:FE:6C:0A
退出节点: node1,node2
----

使用EVPN区域 `myevpnzone` 创建名为 `myvnet1` 的第一个虚拟网络（VNet）。

----
ID: myvnet1
Zone: myevpnzone
Tag: 11000
----

在`myvnet1`上创建一个子网：

----
子网：10.0.1.0/24
网关：10.0.1.1
----

创建名为 `myvnet2` 的第二个虚拟网络，使用相同的 EVPN 区域 `myevpnzone`。

----
ID: myvnet2
区域: myevpnzone
标签: 12000
----

在`myvnet2`上创建一个不同的子网；

----
子网：10.0.2.0/24
网关：10.0.2.1
----

从主SDN网络界面面板应用配置，在每个节点上本地创建虚拟网络并生成FRR配置。

在节点node1上创建一个基于Debian的虚拟机（'vm1'），其虚拟网络接口连接到`myvnet1`。

使用以下网络配置为 'vm1':

----
auto eth0
iface eth0 inet static
	address 10.0.1.100/24
	gateway 10.0.1.1
	mtu 1450
----

在节点node2上创建第二个虚拟机（'vm2'），并在另一个虚拟网络`myvnet2`上配置一个虚拟网络接口卡（vNIC）。

请使用以下网络配置为'vm2'：

----
auto eth0
iface eth0 inet static
	address 10.0.2.100/24
	gateway 10.0.2.1
	mtu 1450
----

现在你应该能够从vm1 ping到vm2，以及从vm2 ping到vm1。

如果你从非网关节点node3上的'vm2' ping一个外部IP，数据包将会发送到配置的'myvnet2' 网关，然后会被路由到出口节点（'node1'或者'node2'），并且从那里通过在node1或node2上配置的默认网关离开这些节点。

NOTE: 您需要在外部网关上为'10.0.1.0/24'和'10.0.2.0/24'网络添加反向路由到node1和node2，以便公网能够回复。

如果你配置了一个外部的BGP路由器，在这个例子中BGP-EVPN路由（10.0.1.0/24 和 10.0.2.0/24），将会被动态宣告。

[[pvesdn_notes]]
笔记
--

多个EVPN出口节点
~~~~~~~~~~

如果您有多个网关节点，应该禁用`rp_filter`（严格反向路径过滤）选项，因为数据包可能从一个节点到达但从另一个节点离开。

将以下内容添加到 `/etc/sysctl.conf`：

-----
net.ipv4.conf.default.rp_filter=0
net.ipv4.conf.all.rp_filter=0
-----

VXLAN IPSEC 加密
~~~~~~~~~~~~~~

要在VXLAN上添加IPSEC加密，这个例子展示了如何使用`strongswan`。

您需要为IPv4额外减少60字节，或者为IPv6减少80字节的'MTU'，以便处理加密。

所以，在默认的真实1500 MTU的情况下，你需要使用1370的MTU（1370 + 80（IPSEC）
+ 50 (VXLAN) == 1500).

在主机上安装strongswan。

----
apt install strongswan
----

将配置添加到 `/etc/ipsec.conf` 文件中。我们只需要加密来自 VXLAN UDP 端口 '4789' 的流量。

----
conn %default
    ike=aes256-sha1-modp1024!  # 最快的，但在现代硬件上相当安全的密码
    esp=aes256-sha1!
    leftfirewall=yes           # 使用Proxmox VE防火墙规则时这是必需的

conn output
    rightsubnet=%dynamic[udp/4789]
    right=%any
    type=transport
    authby=psk
    auto=route

conn input
    leftsubnet=%dynamic[udp/4789]
    type=transport
    authby=psk
    auto=route
----

使用以下方法生成一个预共享密钥：

----
openssl rand -base64 128
----

将密钥添加到`/etc/ipsec.secrets`文件中，使得文件内容如下所示：

----
: PSK <generatedbase64key>
----

将PSK（预共享密钥）和配置复制到参与VXLAN网络的所有节点。

[[chapter_pve_firewall]]

{pve} 防火墙
=========
:pve-toplevel:

{pve} 防火墙为保护您的 IT 基础设施提供了一种简单的方法。您可以为集群内的所有主机设置防火墙规则，或为虚拟机和容器定义规则。诸如防火墙宏、安全组、IP集和别名之类的功能有助于简化这项任务。

虽然所有配置都存储在集群文件系统上，但基于`iptables`的防火墙服务在每个集群节点上运行，因此提供了虚拟机之间的完全隔离。这种系统的分布式特性也比中央防火墙解决方案提供了更高的带宽。

防火墙完全支持IPv4和IPv6。IPv6支持是完全透明的，默认情况下我们会过滤两种协议的流量。因此，没有必要为IPv6维护一套不同的规则。

区域
--

Proxmox VE 防火墙将网络分为以下逻辑区域：

主机::

集群节点的进出流量

虚拟机::

特定虚拟机的流量出入

对于每个区域，您可以为进出流量定义防火墙规则。

配置文件
----

所有与防火墙相关的配置都存储在proxmox集群文件系统上。因此，这些文件会自动分发到所有集群节点上，并且当配置发生变化时，`pve-firewall`服务会自动更新底层的`iptables`规则。

你可以使用GUI配置任何东西（即*数据中心*->*防火墙*，或者在*节点*->*防火墙*上），或者你可以使用你喜欢的编辑器直接编辑配置文件。

防火墙配置文件包含许多键值对的部分。以`#`开头的行和空白行被视为注释。各个部分以一个标题行开始，包含用`[`和`]`括起来的部分名称。

[[pve_firewall_cluster_wide_setup]]
集群范围设置
~~~~~~

集群范围内的防火墙配置存储在：

/etc/pve/firewall/cluster.fw

配置可以包含以下几个部分：

[OPTIONS]::

这用于设置集群范围的防火墙选项。

ebtables`: `<boolean>` ('default =' `1`)::

在整个集群范围内启用ebtables规则。

enable`: `<integer> (0 - N)::

在整个防火墙群集中启用或禁用。

log_ratelimit`: `[enable=]<1|0> [,burst=<integer>] [,rate=<rate>]::

日志速率限制设置

burst`=`<integer> (0 - N)` ('default =' `5`);;

率先应用速率之前将始终被记录的一系列初始数据包 burst 包装

enable`=`<boolean>` ('default =' `1`);;

启用或禁用日志速率限制

rate`=`<rate>` ('default =' `1/second`);;

爆发令牌桶的填充频率

policy_in`: `<ACCEPT | DROP | REJECT>::

输入策略。

policy_out`：`<接受 | 丢弃 | 拒绝>::

输出政策。

[RULES]::

这一部分包含了适用于所有节点的集群范围防火墙规则。

[IPSET <name>]::

集群范围的IP集定义。

[GROUP <name>]::

集群范围的安全组定义。

[ALIASES]::

集群范围内的别名定义。

开启防火墙
^^^^^

默认情况下，防火墙是完全禁用的，因此你需要在这里设置启用选项：

----
[OPTIONS]
# enable firewall (cluster-wide setting, default is disabled)
enable: 1
----

IMPORTANT: 如果你启用防火墙，默认情况下所有主机的流量都会被阻止。唯一的例外是你的本地网络中的WebGUI（8006）和ssh（22）。

如果您想要从远程管理您的{pve}主机，您需要创建规则，允许那些远程IP通过网络GUI（端口8006）访问。您可能还想允许ssh（端口22），以及可能的SPICE（端口3128）。

TIP: 请在启用防火墙之前，先通过SSH连接到其中一个{PVE}主机。这样如果出了什么问题，你仍然可以访问到主机。

为了简化这项任务，你可以创建一个名为“management”的IPSet，并在其中添加所有远程IP。这样就能创建所有必要的防火墙规则来实现从远程访问GUI。

[[pve_firewall_host_specific_configuration]]
主机特定配置
~~~~~~

主机相关配置读取自：

/etc/pve/nodes/<nodename>/host.fw

如果你想要覆盖来自`cluster.fw`配置的规则，这会很有用。你还可以提高日志的详细性，以及设置与netfilter相关的选项。配置可以包含以下部分：

[OPTIONS]::

这用于设置与主机相关的防火墙选项。

enable`: `<boolean>::

启用主机防火墙规则。

log_level_in`: `<alert | crit | debug | emerg | err | info | nolog | notice | warning>::

传入流量的日志级别。

log_level_out`: `<alert | crit | debug | emerg | err | info | nolog | notice | warning>::

出站流量的日志级别。

log_nf_conntrack`: `<boolean>` ('default =' `0`)::

启用连接跟踪信息的记录。

ndp`: `<boolean>` ('default =' `0`)::

启用NDP（邻居发现协议）。

nf_conntrack_allow_invalid`: `<boolean>` ('default =' `0`)::

在连接跟踪中允许无效的数据包。

nf_conntrack_helpers`: `<string>` ('default =' ``)::

为特定协议启用连接跟踪助手。支持的协议有：amanda, ftp, irc, netbios-ns, pptp, sane, sip, snmp, tftp

nf_conntrack_max`: `<integer> (32768 - N)` ('default =' `262144`)::

最大追踪连接数。

nf_conntrack_tcp_timeout_established`: `<integer> (7875 - N)` ('default =' `432000`)::

Conntrack 已建立超时。

nf_conntrack_tcp_timeout_syn_recv`: `<integer> (30 - 60)` ('default =' `60`)::

Conntrack同步接收超时。

nosmurfs`: `<boolean>::

启用SMURFS过滤器。

protection_synflood`: `<boolean>` ('default =' `0`)::

启用synflood攻击保护

protection_synflood_burst`: `<integer>` ('default =' `1000`)::

根据源 IP 的 Synflood 保护速率爆发。

protection_synflood_rate`: `<integer>` ('default =' `200`)::

源IP的每秒SYN泛洪保护速率。

smurf_log_level```: ```<alert | crit | debug | emerg | err | info | nolog | notice | warning>::

SMURFS过滤器的日志级别。

tcp_flags_log_level`: `<alert | crit | debug | emerg | err | info | nolog | notice | warning>::

非法TCP标志过滤器的日志级别。

tcpflags`：`<boolean>`（默认值=`0`）::

过滤TCP标志的非法组合。

[RULES]::

这一部分包含了针对主机的特定防火墙规则。

[[pve_firewall_vm_container_configuration]]
VM/容器配置
~~~~~~~

VM防火墙配置读取自：

/etc/pve/firewall/<VMID>.fw

包含以下数据：

[OPTIONS]::

这用于设置虚拟机/容器相关的防火墙选项。

dhcp`: `<boolean>` ('default =' `0`)::

启用DHCP。

enable`: `<boolean>` ('default =' `0`)::

启用/禁用防火墙规则。

ipfilter`: `<boolean>::

启用默认的IP过滤器。这等同于为每个接口添加一个空的ipfilter-net<id> ipset集。这样的ipset隐含地包含理智的默认限制，例如限制IPv6链路本地地址到从接口的MAC地址派生的那一个。对于容器，配置的IP地址将被隐含地添加。

log_level_in`: `<alert | crit | debug | emerg | err | info | nolog | notice | warning>::

输入流量的日志级别。

log_level_out`: `<alert | crit | debug | emerg | err | info | nolog | notice | warning>::

出站流量的日志级别。

macfilter`: `<boolean>` ('default =' `1`)::

启用/禁用MAC地址过滤。

ndp`: `<boolean>` ('default =' `0`)::

启用NDP（邻居发现协议）。

policy_in`: `<ACCEPT | DROP | REJECT>::

输入策略。

policy_out`: `<接受 | 丢弃 | 拒绝>::

输出策略。

radv`: `<boolean>::

允许发送路由器通告。

[RULES]::

这部分包含了虚拟机/容器的防火墙规则。

[IPSET <name>]::

IP集合定义。

[ALIASES]::

IP别名定义。

为虚拟机和容器启用防火墙
^^^^^^^^^^^^

每个虚拟网络设备都有自己的防火墙启用标志。因此，您可以为每个接口选择性地启用防火墙。这需要额外于一般防火墙的 `enable` 选项。

防火墙规则
-----

防火墙规则由方向（`IN` 或 `OUT`）和动作（`ACCEPT`, `DENY`, `REJECT`）组成。您还可以指定宏名称。宏包含预定义的规则集和选项。可以通过在规则前加上 `|` 来禁用它们。

.防火墙规则语法
----
[RULES]

DIRECTION ACTION [OPTIONS]
|DIRECTION ACTION [OPTIONS] # disabled rule

DIRECTION MACRO(ACTION) [OPTIONS] # 使用预定义宏
----

以下选项可用于精确规则匹配。

--dest` `<string>::

限制数据包的目的地址。这可以指单个IP地址、一个IP集（'+ipsetname'）或一个IP别名定义。您还可以指定一个地址范围，如 '20.34.101.207-201.3.9.99'，或一个IP地址和网络的列表（条目之间用逗号分隔）。请不要在这样的列表中混合IPv4和IPv6地址。

--dport` `<string>::

限制TCP/UDP目的端口。你可以使用服务名称或简单数字（0-65535），如'/etc/services'中定义。端口范围可以用'\d+:\d+'指定，例如'80:85'，你也可以使用逗号分隔列表来匹配多个端口或范围。

--icmp-type` `<string>::

指定ICMP类型。只有当协议等于'icmp'或者'icmpv6'/'ipv6-icmp'时有效。

--iface` `<string>::

网络接口名称。您必须对虚拟机和容器使用网络配置键名（'net\d+'）。与主机相关的规则可以使用任意字符串。

--log` `<alert | crit | debug | emerg | err | info | nolog | notice | warning>::

防火墙规则的日志级别。

--proto` `<string>::

IP协议。您可以使用协议名称（'tcp'/'udp'）或在'/etc/protocols'中定义的简单数字。

--source` `<string>::

限制数据包源地址。这可以指一个单独的IP地址、一个IP集（'+ipsetname'）或一个IP别名定义。您还可以指定一个地址范围，如 '20.34.101.207-201.3.9.99'，或者一个IP地址和网络的列表（条目之间用逗号隔开）。请不要在这样的列表中混用IPv4和IPv6地址。

--sport` `<string>::

限制TCP/UDP源端口。您可以使用服务名称或简单的数字（0-65535），如'/etc/services'中所定义。端口范围可以用'\d+:\d+'指定，例如'80:85'，并且您可以使用逗号分隔的列表来匹配多个端口或范围。

这里有一些例子：

----
[RULES]
IN SSH(ACCEPT) -i net0
IN SSH(ACCEPT) -i net0 # 一条注释
IN SSH(ACCEPT) -i net0 -source 192.168.2.192 # 仅允许来自192.168.2.192的SSH
IN SSH(ACCEPT) -i net0 -source 10.0.0.1-10.0.0.10 # 接受IP范围内的SSH连接
IN SSH(ACCEPT) -i net0 -source 10.0.0.1,10.0.0.2,10.0.0.3 #接受IP列表中的ssh连接
IN SSH(ACCEPT) -i net0 -source +mynetgroup # 接受ipset mynetgroup中的ssh连接
IN SSH(ACCEPT) -i net0 -source myserveralias #接受别名myserveralias的ssh连接

|IN SSH(ACCEPT) -i net0 # disabled rule

IN  DROP # drop all incoming packages
OUT ACCEPT # accept all outgoing packages
----

[[pve_firewall_security_groups]]
安全组
---

安全组是一组规则的集合，在集群级别定义，可以用于所有虚拟机的规则中。例如，您可以定义一个名为“webserver”的组，其中包含开放“http”和“https”端口的规则。

----
# /etc/pve/firewall/cluster.fw

[group webserver]
IN  ACCEPT -p tcp -dport 80
IN  ACCEPT -p tcp -dport 443
----

然后，你可以将这个组添加到虚拟机的防火墙中

----
# /etc/pve/firewall/<VMID>.fw

[RULES]
GROUP webserver
----

[[pve_firewall_ip_aliases]]
IP别名
----

IP别名允许您将网络的IP地址与一个名称关联起来。然后，您可以引用这些名称：

* 内部IP集定义
* 在防火墙规则中的`source`和`dest`属性

标准IP别名 `local_network
~~~~~~~~~~~~~~~~~~~~~

这个别名已经自动定义。请使用以下命令来查看已分配的值：

----
# pve-firewall localnet
local hostname: example
local IP address: 192.168.2.100
network auto detect: 192.168.0.0/20
using detected local_network: 192.168.0.0/20
----

防火墙会自动设置规则，使用这个别名允许集群通信（corosync、API、SSH）所需的一切。

用户可以在`cluster.fw`别名部分中覆盖这些值。如果你在公共网络上使用单个主机，最好是明确指定本地IP地址。

----
#  /etc/pve/firewall/cluster.fw
[ALIASES]
local_network 1.2.3.4 # use the single IP address
----

[[pve_firewall_ip_sets]]
IP 集
----

IP集合可用于定义网络和主机的群组。在防火墙规则的`source`和`dest`属性中，你可以使用`+name`来引用它们。

以下示例允许来自`management` IP集的HTTP流量。

IN HTTP(ACCEPT) -source +management

标准IP集`管理
~~~~~~~~

这个IP集只适用于主机防火墙（不适用于虚拟机防火墙）。这些IP允许执行正常的管理任务（{PVE} GUI、VNC、SPICE、SSH）。

本地集群网络会被自动添加到此IP集合中（别名 `cluster_network`），以便开启主机间的集群通信。（多播，ssh等）

----
# /etc/pve/firewall/cluster.fw

[IPSET管理]
192.168.2.10
192.168.2.10/24
----

标准IP集 `blacklist
~~~~~~~~~~~~~~~~

来自这些IP的流量会被每个主机和虚拟机的防火墙丢弃。

----
# /etc/pve/firewall/cluster.fw

[IPSET 黑名单]
77.240.159.182
213.87.123.0/24
----

[[pve_firewall_ipfilter_section]]
标准 IP 集 `ipfilter-net*
~~~~~~~~~~~~~~~~~~~~~~

这些过滤器属于虚拟机的网络接口，主要用于防止IP欺骗。如果接口有这样的过滤器集，那么任何源IP与其接口相应的ipfilter集不匹配的传出流量都将被丢弃。

对于配置了IP地址的容器，如果这些集合存在（或通过虚拟机防火墙的*选项*标签中的通用`IP过滤`选项激活），则隐含包含了关联的IP地址。

对于虚拟机和容器，它们也隐含包含了标准的MAC派生的IPv6链路本地地址，以便允许邻居发现协议正常工作。

----
/etc/pve/firewall/<VMID>.fw

[IPSET ipfilter-net0] # 仅允许特定的IP地址在net0上
192.168.2.10
----

服务和命令
-----

防火墙在每个节点上运行两个服务守护进程。

* pvefw-logger：NFLOG守护进程（ulogd的替代品）。
* pve-firewall: 更新iptables规则

还有一个命令行指令，名为`pve-firewall`，可用于启动和停止防火墙服务：

# pve-firewall start
 # pve-firewall stop

要获取状态，请使用：

 # pve-firewall status

上述命令读取并编译所有防火墙规则，因此如果您的防火墙配置中包含任何错误，您将看到警告。

如果你想查看生成的iptables规则，可以使用：

# iptables-save

[[pve_firewall_default_rules]]
默认防火墙规则
-------

默认防火墙配置过滤了以下流量：

数据中心进站/出站的丢弃/拒绝操作
~~~~~~~~~~~~~~~~~

如果防火墙的输入或输出策略设为DROP或REJECT，那么以下流量仍被允许通过所有集群中的{pve}主机：

* 回环接口上的流量
* 已建立的连接
* 使用IGMP协议的流量
* 允许管理主机通过TCP流量访问端口8006以便访问网页界面
* 允许管理主机通过TCP流量访问5900到5999端口范围内的VNC网络控制台的流量
* 管理主机的TCP流量经过3128端口连接到SPICE代理。
* 允许管理主机通过TCP协议访问22端口以使用ssh进行远程访问
* 在集群网络中的UDP流量到端口5405-5412用于corosync
* 集群网络中的UDP组播流量
* ICMP流量类型3（目的地不可达）、4（拥塞控制）或11（超时）。

即使启用了日志记录，以下流量也会被丢弃，但不会被记录：

* 连接状态无效的TCP连接
* 不涉及corosync的广播、多播和任播流量，即不通过5405-5412端口传送的流量。
* 向端口43的TCP流量
* 向端口135和445的UDP流量
* UDP流量到端口范围137至139
* UDP流量从源端口137到端口范围1024至65535
* UDP流量到端口1900
* TCP流量到端口135、139和445
* 源自源端口53的UDP流量

剩余的流量分别被丢弃或拒绝，并且也会被记录。这可能会根据在*防火墙* -> *选项*中启用的额外选项而有所不同，如NDP、SMURFS和TCP标志过滤。

[[pve_firewall_iptables_inspect]]
请检查输出的结果

----
# iptables-save
----

system command to see the firewall chains and rules active on your system. This output is also included in a `System Report`, accessible over a node's subscription tab in the web GUI, or through the `pvereport` command-line tool.

VM/CT 进入/离开 丢弃/拒绝
~~~~~~~~~~~~~~~~~

此操作将丢弃或拒绝所有传送至虚拟机的流量，但根据设置的配置，对于DHCP、NDP、路由器广告、MAC和IP过滤等有一些例外。用于丢弃/拒绝数据包的相同规则从数据中心继承而来，而针对主机接受的进/出流量的例外则不适用。

再次提醒，你可以使用xref:pve_firewall_iptables_inspect[iptables-save (见上文)]来检查所有应用的规则和链条。

防火墙规则记录
-------

默认情况下，防火墙规则过滤的流量日志记录功能是禁用的。要启用日志记录，必须在*Firewall* -> *Options*中为传入和/或传出流量设置`loglevel`。这可以为主机以及VM/CT防火墙单独进行设置。通过这种方式，启用了{PVE}的标准防火墙规则的日志记录，并且可以在*Firewall* -> *Log*中观察到输出。此外，对于标准规则，只有一些被丢弃或拒绝的数据包会被记录（参见xref:pve_firewall_default_rules[默认防火墙规则]）。

loglevel` 并不影响记录了多少过滤后的流量。它改变了一个 `LOGID`，这个 `LOGID` 被作为前缀附加到日志输出上，以便更容易进行过滤和后处理。

loglevel` 是以下标识之一：

[[pve_firewall_log_levels]]
[width="25%", options="header"]
|===================
| loglevel | LOGID
| nolog    | --
| emerg    | 0
| alert    | 1
| crit     | 2
| err      | 3
| warning  | 4
| notice   | 5
| info     | 6
| debug    | 7
|===================

一个典型的防火墙日志输出看起来像这样：

----
VMID 日志ID 链 时间戳 策略：数据包详情
----

在主机防火墙的情况下，`VMID` 等于 0。

用户定义的防火墙规则日志记录
~~~~~~~~~~~~~~

为了记录用户自定义防火墙规则过滤掉的数据包，可以为每条规则单独设置一个日志级别参数。这使得可以以细粒度的方式记录日志，并且与在*防火墙* -> *选项*中为标准规则定义的日志级别独立。

在创建或修改规则的过程中，每个单独规则的`loglevel`可以通过web用户界面轻松地定义或更改，也可以通过相应的`pvesh` API调用来设置。

此外，可以通过在防火墙配置文件中给选择的规则添加 `-log <loglevel>` 来设置日志级别（参见 xref:pve_firewall_log_levels[可能的日志级别]）。

例如，下面两者是相同的：

----
IN REJECT -p icmp -log nolog
IN REJECT -p icmp
----

然而

----
IN REJECT -p icmp -log debug
----

产生一个用`debug`级别标记的日志输出。

小技巧和窍门
# apt-get install suricata
# modprobe nfnetlink_queue
# /etc/pve/firewall/<VMID>.fw

[OPTIONS]
ips: 1
ips_queues: 0
# /etc/default/suricata
NFQUEUE=0
# user1 of People at ldap-test.com
dn: uid=user1,ou=People,dc=ldap-test,dc=com
objectClass: top
objectClass: person
objectClass: organizationalPerson
objectClass: inetOrgPerson
uid: user1
cn: Test User 1
sn: Testers
description: This is the first test user.
pveum realm sync <realm>
pveum realm add myrealm1 --type openid --issuer-url  https://accounts.google.com --client-id XXXX --client-key YYYY --username-claim email
pveum realm add myrealm2 --type openid --issuer-url  https://your.server:8080/realms/your-realm --client-id XXX --username-claim username
 pveum user tfa unlock joe@pve
webauthn: rp=mypve.example.com,origin=https://mypve.example.com:8006,id=mypve.example.com
u2f: appid=https://mypve.example.com:8006
pveum role add VM_Power-only --privs "VM.PowerMgmt VM.Console"
pveum role add Sys_Power-only --privs "Sys.PowerMgmt Sys.Console"
对不起，"pveum"似乎不是一个有意义的词汇或者是拼写错误，无法进行翻译。
帮助用户添加
pveum user add testuser@pve -comment "Just a test"
pveum passwd testuser@pve
pveum user modify testuser@pve -enable 0
pveum group add testgroup
pveum role add PVE_Power-only -privs "VM.PowerMgmt VM.Console"
pveum group add admin -comment "System Administrators"
pveum acl modify / -group admin -role Administrator
pveum user modify testuser@pve -group admin
pveum acl modify / -user joe@pve -role PVEAuditor
pveum acl modify /vms -user joe@pve -role PVEAuditor
pveum acl modify /access -user joe@pve -role PVEUserAdmin
 pveum acl modify /access/realm/pve -user joe@pve -role PVEUserAdmin
 pveum acl modify /access/groups/customers -user joe@pve -role PVEUserAdmin
pveum acl modify /vms -user joe@pve -role PVEVMAdmin
pveum user token add joe@pve monitoring -privsep 1
pveum acl modify /vms -token 'joe@pve!monitoring' -role PVEAuditor
pveum user permissions joe@pve
pveum user token permissions joe@pve monitoring
pveum group add developers -comment "Our software developers"
pveum user add developer1@pve -group developers -password
pveum pool add dev-pool --comment "IT development pool"
pveum acl modify /pool/dev-pool/ -group developers -role PVEAdmin
# ha-manager add vm:100
# ha-manager set vm:100 --state stopped
# ha-manager set vm:100 --state started
# qm start 100
# ha-manager config
vm:100
	state stopped
# ha-manager status
quorum OK
master node1 (active, Wed Nov 23 11:07:23 2016)
lrm elsa (active, Wed Nov 23 11:07:19 2016)
service vm:100 (node1, started)
# ha-manager migrate vm:100 node2
# ha-manager relocate vm:100 node2
# ha-manager remove vm:100
# ha-manager status
quorum OK
master elsa (active, Mon Nov 21 07:23:29 2016)
lrm elsa (active, Mon Nov 21 07:23:22 2016)
service ct:100 (elsa, stopped)
service ct:102 (elsa, started)
service vm:501 (elsa, started)
apt install pve-ha-simulator
ssh root@<IPofPVE> -Y
mkdir working
pve-ha-simulator 正在工作/
<type>: <name>
	<property> <value>
	...
vm: 501
state started
max_relocate 2

ct: 102
    # Note: use default settings for everything
# ha-manager add vm:501 --state started --max_relocate 2
# ha-manager add ct:102
group: <group>
nodes <node_list>
<property> <value>
...
# ha-manager groupadd prefer_node1 --nodes node1
# ha-manager groupadd mygroup1 -nodes "node1:2,node2:1,node3:1,node4"
# ha-manager groupadd mygroup2 -nodes "node1,node2" -restricted
group: prefer_node1
       nodes node1

group: mygroup1
       nodes node2:1,node4,node1:2,node3:1

group: mygroup2
nodes node2,node1
restricted 1
# 选择看门狗模块（默认为softdog）
WATCHDOG_MODULE=iTCO_wdt
# ha-manager set vm:100 --state disabled
# ha-manager crm-command node-maintenance enable NODENAME
# ha-manager crm-command node-maintenance disable NODENAME
ha: 关闭政策=<值>
crs: ha=static
# pvesm set STORAGEID --bwlimit restore=KIBs
tmpdir: /mnt/fast_local_disk
storage: my_backup_storage
mode: snapshot
bwlimit: 10000
# vzdump 777 --exclude-path /tmp/ --exclude-path '/var/foo*'
sendmail: example
        mailto-user root@pam
        mailto-user admin@pve
        mailto max@example.com
        from-address pve1@example.com
        comment Send to multiple users/addresses
smtp: example
mailto-user root@pam
mailto-user admin@pve
mailto max@example.com
from-address pve1@example.com
username pve1
server mail.example.com
mode starttls
smtp: example
password somepassword
gotify: 示例
服务器 http://gotify.example.com:8888
评论 发送给多个用户/地址
gotify: example
token somesecrettoken
matcher: always-matches
        target admin
        comment This matcher always matches
matcher: workday
match-calendar mon-fri 9-17
target admin
comment Notify admins during working hours

matcher: night-and-weekend
        match-calendar mon-fri 9-17
        invert-match true
        target on-call-admins
        comment Separate target for non-working hours
matcher: backup-failures
        match-field exact:type=vzdump
        match-severity error
        target backup-admins
        comment Send notifications about backup failures to one group of admins

matcher: cluster-failures
match-field exact:type=replication
match-field exact:type=fencing
mode any
target cluster-admins
comment Send cluster-related notifications to other group of admins
matcher: cluster-failures
match-field regex:type=^(replication|fencing)$
target cluster-admins
comment Send cluster-related notifications to other group of admins
ALLOW_FROM="10.0.0.1-10.0.0.5,192.168.0.0/22"
DENY_FROM="all"
POLICY="allow"
LISTEN_IP="192.0.2.1"
LISTEN_IP="2001:db8:85a3::1"
LISTEN_IP="fe80::c463:8cff:feb9:6a4e%vmbr0"
systemctl restart pveproxy.service spiceproxy.service
# pvesh get /nodes
egrep '(vmx|svm)' /proc/cpuinfo
apt update
apt full-upgrade
星期几 年-月-日 小时:分钟[:秒]

RAID0	也被称为“条带化”。这种卷的容量是所有磁盘容量的总和。但是RAID0没有增加任何冗余，因此单个驱动器的故障将使卷不可用。
RAID1	也被称为“镜像”。数据被一致地写入所有磁盘。这种模式至少需要2个相同大小的磁盘。最终的容量是单个磁盘的容量。
RAID10	RAID0和RAID1的组合。至少需要4块磁盘。
RAIDZ-1	RAID-5变种，单一奇偶校验。至少需要3个磁盘。
RAIDZ-2	RAID-5的一个变体，双重奇偶校验。至少需要4个磁盘。
RAIDZ-3	RAID-5的一种变体，三重奇偶校验。至少需要5块磁盘。

页眉	在顶部。显示状态信息，并包含最重要操作的按钮。
资源树	在左边。一个导航树，您可以在其中选择特定的对象。
内容面板	中心区域。选中的对象在这里显示配置选项和状态。
日志面板	在底部。显示最近任务的日志条目。您可以双击这些日志条目以获取更多细节，或者中止正在运行的任务。

文档	打开一个新的浏览器窗口，显示参考文档。
创建虚拟机	打开虚拟机创建向导。
创建 CT	打开容器创建向导。
用户菜单	显示你当前登录用户的身份，点击它会打开一个带有用户特定选项的菜单。在用户菜单中，您将找到“我的设置”对话框，它提供了本地UI设置。在此之下，有“TFA”（双因素认证）和“密码”自助服务的快捷方式。您还会找到更改“语言”和“颜色主题”的选项。最后，在菜单的底部是“注销”选项。

字体族	在xterm.js中使用的字体（例如Arial）。
字体大小	应使用的首选字体大小。
字母间距	增加或减少文本中字母之间的间距。
行高	指定线条的绝对高度。

数据中心	包含全集群范围的设置（对所有节点都相关）。
节点	表示集群中的主机，客户端在此运行。
客人	虚拟机、容器和模板。
存储	数据存储。
泳池	可以通过一个池来对客人进行分组，以简化管理。

服务器视图	按节点分组展示各种对象。
文件夹视图	按对象类型分组显示所有类型的对象。
泳池景观	按池分组展示虚拟机和容器。

描述	插件类型	层级	共享	快照	稳定性
ZFS (本地)	`zfspool`	双重¹	否	是	是
目录	`dir`	文件	否	否²	是
BTRFS	`btrfs`	文件	否	是	技术预览
NFS	`nfs`	文件	是	否²	是
CIFS	`cifs`	文件	是	否²	是
Proxmox 备份	`pbs`	双重	是	不适用	是
GlusterFS	`glusterfs`	文件	是	否²	是
CephFS	`cephfs`	文件	是	是	是
LVM	`lvm`	块级	否³	否	是
LVM-thin	`lvmthin`	块级	否	是	是
iSCSI/kernel	`iscsi`	块级	是	否	是
iSCSI/libiscsi	`iscsidirect`	块级	是	否	是
Ceph/RBD	`rbd`	块级	是	是	是
ZFS over iSCSI	`zfs`	块级	是	是	是

Content type	Subdir
VM images	`images/<VMID>/`
ISO images	`template/iso/`
Container templates	`template/cache/`
Backup files	`dump/`
Snippets	`snippets/

警告	如果建议的`pg_num`值与当前值相差过大，则会发出健康警告。
开或者在上	pg_num`会自动调整，无需任何手动干预。
关闭	不会自动调整`pg_num`的数量，如果PG数量不是最优，也不会发出警告。

其他	未指定操作系统
wxp	微软Windows XP
w2k	微软Windows 2000
w2k3	微软 Windows 2003
W2k8 是Windows Server 2008的简称，没有直译的中文意思，通常指的是"Windows Server 2008"这个微软发布的服务器操作系统版本。	微软 Windows 2008
wvista	微软Windows Vista
win7	微软 Windows 7
win8	微软Windows 8/2012/2012r2
win10	微软Windows 10/2016/2019
win11	微软Windows 11/2022
l24	Linux 2.4 内核
l26	Linux 2.6 - 6.X 内核
太阳神	Solaris/OpenSolaris/OpenIndiana 内核

可用性百分比	每年停机时间
99	3.65天
99.9	8.76小时
99.99	52.56分钟
99.999	5.26分钟
99.9999	31.5秒
99.99999	3.15秒

{pve} 版本	Debian 版本	首次发布	Debian 终止支持	Proxmox 终止支持
{pve} 8	Debian 12 (Bookworm)	2023-06	待定	待定
{pve} 7	Debian 11 (Bullseye)	2021-07	2024-07	2024-07
{pve} 6	Debian 10 (Buster)	2019-07	2022-09	2022-09
{pve} 5	Debian 9 (Stretch)	2017-07	2020-07	2020-07
{pve} 4	Debian 8 (Jessie)	2015-10	2018-06	2018-06
{pve} 3	Debian 7 (Wheezy)	2013-05	2016-04	2017-02
{pve} 2	Debian 6 (Squeeze)	2012-04	2014-05	2014-05
{pve} 1	Debian 5 (Lenny)	2008-10	2012-03	2013-01

数值	语法
`minutely`	`--* ::00`
`hourly`	`--* *:00:00`
`daily`	`--* 00:00:00`
`weekly`	`mon --* 00:00:00`
`monthly`	`--01 00:00:00`
`yearly` or `annually`	`*-01-01 00:00:00`
`quarterly`	`*-01,04,07,10-01 00:00:00`
`semiannually` or `semi-annually`	`*-01,07-01 00:00:00

时间表字符串	替代	含义
周一,周二,周三,周四,周五	周一..周五	每个工作日的0:00
周六,周日	周六..周日	只在周末的0:00
周一,周三,周五	—	只在周一、周三和周五的0:00
12:05	12:05	每天的下午12:05
*/5	0/5	每五分钟
周一..周三 30/10	周一,周二,周三 30/10	周一、周二、周三每个整点后的30、40和50分钟
周一..周五 8..17,22:0/15	—	每个工作日的上午8点至下午6点和晚上10点至11点之间，每15分钟
周五 12..13:5/20	周五 12,13:5/20	周五在12:05、12:25、12:45、13:05、13:25和13:45
12,14,16,18,20,22:5	12/2:5	每天从12:05开始直至22:05，每2小时一次
*	*/1	每分钟（最小间隔）
*-05	—	每月的第5天
周六 *-1..7 15:00	—	每月的第一个周六在15:00
2015-10-21	—	2015年10月21日的0:00

Proxmox VE 管理指南

1. 引言

1.1. 中央管理系统

1.2. 灵活存储

1.3. 集成备份和恢复

1.4. 高可用性集群

1.5. 灵活网络

1.6. 集成防火墙

1.7. 超融合基础设施

1.7.1. 超融合基础设施（HCI）的优势{pve}

1.7.2. 超融合基础设施：存储

1.8. 为什么选择开源

1.9. 您与{pve}的福利

1.10. 获取帮助

1.10.1. Proxmox VE 维基

1.10.2. 社区支持论坛

1.10.3. 邮件列表

1.10.4. 商业支持

1.10.5. 缺陷跟踪器

1.11. 项目历史

1.12. 完善 {pve} 文档

1.13. 翻译 {pve}

1.13.1. 使用git进行翻译

2. git clone git://git.proxmox.com/git/proxmox-i18n.git

3. cd proxmox-i18n

4. make init-<LANG>.po

5. poedit <LANG>.po

5.1. 不使用git的翻译

5.2. 测试翻译

6. ./po2js.pl -t pve xx.po >pve-lang-xx.js

7. make deb

7.1. 发送翻译

8. 安装 {pve}

8.1. 系统要求

8.1.1. 最低评估要求

8.1.2. 推荐系统要求

8.1.3. 简单性能概览

8.1.4. 支持访问网页界面的网络浏览器

8.2. 准备安装介质

8.2.1. 将USB闪存盘准备为安装介质

8.2.2. GNU/Linux的使用说明

找到正确的USB设备名称

8.2.3. macOS的使用说明

8.2.4. Windows操作说明

使用Etcher

使用Rufus

8.3. 使用 {pve} 安装程序

8.3.1. 安装后访问管理界面

8.3.2. 高级LVM配置选项

8.3.3. 高级ZFS配置选项

8.3.4. ZFS 性能提示

8.4. Install {pve} on Debian

9. 主机系统管理

9.1. 软件包仓库

9.1.1. 仓库在 {pve} 中

代码仓库管理

源列表

9.1.2. {pve} 企业代码库

9.1.3. {pve} 无订阅存储库

9.1.4. {pve} 测试仓库

9.1.5. Ceph礁石企业仓库

9.1.6. Ceph礁石无订阅仓库

9.1.7. Ceph礁测试库

9.1.8. Ceph Quincy 企业版仓库

9.1.9. Ceph Quincy 无订阅仓库

9.1.10. Ceph Quincy 测试库

9.1.11. 旧的Ceph仓库

9.1.12. Debian固件仓库

9.1.13. 安全软件包管理器

9.2. 系统软件更新

9.3. 固件更新

9.3.1. 持久固件

9.3.2. 运行时固件文件

9.3.3. CPU 微码更新

设置早期操作系统微码更新

微码版本

故障排除

9.4. 网络配置

9.4.1. 应用网络更改

使用ifupdown2的实时重载网络

12.1. 为 `/var/lib/vz` 创建一个额外的逻辑卷