https://jvns.ca/blog/2022/02/23/getaddrinfo-is-kind-of-weird/ https://icloudnative.io/posts/resolvconf-tutorial DNS 的坑:

  • ssh 中的 UseDNS
  • socket.getaddrinfo
  • libvirt 热迁移
  • 时钟同步

![image 20220614205335.png](Pasted image 20220614205335.png)

getaddrinfo函数

MacOS有DNS缓存,但Linux一般没有,除非使用systemd-resolved 等工具

getaddrinfo 函数是C标准库 libc 的一部分,目前大概有三种libc,它们对getaddrinfo有不同的实现:

  1. glibc (GNU libc)
  2. musl libc
  3. the Mac OS version of libc (I don’t know if this has a name)

Because getaddrinfo is so widely used, you’ll often see it in error messages related to DNS.

For example if I run this Python program which looks up nonexistent domain name:

import requests

requests.get("http://xyxqqx.com")

I get this error message:

Traceback (most recent call last):
  File "/usr/lib/python3.10/site-packages/urllib3/connection.py", line 174, in _new_conn
    conn = connection.create_connection(
  File "/usr/lib/python3.10/site-packages/urllib3/util/connection.py", line 72, in create_connection
    for res in socket.getaddrinfo(host, port, family, socket.SOCK_STREAM):
  File "/usr/lib/python3.10/socket.py", line 955, in getaddrinfo
    for res in _socket.getaddrinfo(host, port, family, type, proto, flags):
socket.gaierror: [Errno -2] Name or service not known

I think socket.getaddrinfo is calling libc getaddrinfo somewhere under the hood, though I did not read all of the source code to check.

Before you learn what getaddrinfo is, it’s not at all obvious that socket.gaierror: [Errno -2] Name or service not known means “that domain doesn’t exist”. It doesn’t even say the words “DNS” or “domain” in it anywhere!

重新夺回对 /etc/resolv.conf 的控制权

随着 Linux 的不断发展壮大,涌现出了各种各样的 DNS 自动管理程序,它们都想要直接获得 /etc/resolv.conf 的控制权,有些人欣然接受,有些人则无法接受。如果你是无法接受的那一方,那么请继续往下看,我会教你如何识别出是哪些程序在控制你的 /etc/resolv.conf 文件,以及如何夺回控制权。

目前能够控制 /etc/resolv.conf 文件的工具大概有这么几个:netconfigNetworkManagerresolvconfrdnssd 和 systemd-resolved。如果你的 /etc/resolv.conf 文件正在被它们控制,那么你对该文件的任何修改都会在几分钟后被覆盖,或者重启后被恢复成原来的值。

要想重新夺回对 /etc/resolv.conf 的控制权,首先就要识别出是谁在控制这个文件。

1. 找出是谁在控制 /etc/resolv.conf

先尝试读取 /etc/resolv.conf 开头的注释,注释里一般会标明是谁在操控该文件:

$ head /etc/resolv.conf

有些工具不会在 /etc/resolv.conf 文件中添加注释,从文件内容里找不到任何蛛丝马迹。这时我们需要换种方法,直接查看该文件是否是一个软链接:

$ ls -l /etc/resolv.conf

如果还是找不到任何线索,那就只能查看系统运行的进程中是否有上面提到的工具。如果还是找不到,那么恭喜你,resolv.conf 已经完全掌控在你的手里,你想怎么改就直接改吧。

接下来将会教你如何禁用自动管理 resolv.conf 的各种程序。

2. NetworkManager

NetworkManager 是最常见的自动配置网络和 DNS 的工具。比如在 Debian 和 Fedora 中它负责配置 /etc/resolv.conf。NetworkManager 可以和其他工具共存,即使禁用了所有其他管理 resolv.conf 的程序,NetworkManager 也会跳出来接管 resolv.conf

可以将 NetworkManager 的主配置部分的选项 dns 设置为 none 来禁用其对 DNS 的管理功能:

$ echo -e "[main]\ndns=none" > /etc/NetworkManager/conf.d/no-dns.conf
$ systemctl restart NetworkManager.service
$ rm /etc/resolv.conf

如果配置完了以后没有生效,那么可能存在配置冲突(通常是由 dnsmasq 引起的),需要找到冲突的配置:

$ grep -ir "\[main\]" /etc/NetworkManager/

3. netconfig

如果是 openSUSESUSE 或其他衍生发行版,一般都是由 netconfig 来控制 resolv.conf。可以通过禁用 /etc/sysconfig/network/config 中的 NETCONFIG_DNS_POLICY 选项来禁用其对 resolv.conf 的控制:

NETCONFIG_DNS_POLICY=""

还要删除 netconfig 生成的 resolv.conf 文件,并重启系统:

$ rm /etc/resolv.conf
$ reboot

现在就可以手动创建 /etc/resolv.conf 文件随意修改了。

4. resolvconf 和 rdnssd

如果是 Debian 8.0 或 Ubuntu 15.04,并且启用了 IPv6,那么你可能会遇到 resolvconf 和 rdnssd 互相争夺 resolv.conf 控制器的情况。两个服务都想控制这个文件,每隔几毫秒就会覆盖对方的配置,从而导致间歇性的 DNS 解析中断。可以直接禁用并立即停止这两个服务:

$ systemctl disable --now resolvconf.service rdnssd.service
$ rm /etc/resolv.conf

最后手动创建 /etc/resolv.conf 文件。

5. systemd-resolved

如果是 Ubuntu 16.10 或更新的版本,则由 systemd-resolved 服务来管理 DNS,可以使用下面的命令来禁用并立即停止该服务:

$ systemctl disable --now systemd-resolved.service
$ rm /etc/resolv.conf

然后手动创建 /etc/resolv.conf 文件。

6. 创建 /etc/resolv.conf

最后的最后,就是手动创建 /etc/resolv.conf 文件了,建议权限设置为 644。配置示例:

nameserver 114.114.114.114
nameserver 223.5.5.5

当然,除了 nameserver 外,还有其他的参数可以配置,感兴趣可以 man 一下:

$ man 5 resolv.conf