Linux DNS 查询剖析(第一部分)
我经常与虚拟机集群打交道(文1、文2、文3、文4、文5、文6),因此最终花费了大量时间试图掌握 DNS 查询的工作原理。遇到问题时,我只是不求甚解的使用 StackOverflow 上的“解决方案”,而不知道它们为什么有时工作,有时不工作。
最终我对此感到了厌倦,决定一并找出所有问题的原因。我没有在网上找到完整的指南,我问过一些同事,他们不知所以然(或许是问题太具体了)。
既然如此,我开始自己写这样的手册。
结果发现,“Linux 执行一次 DNS 查询”这句话的背后有相当多的工作。
“究竟有多难呢?”
本系列文章试图将 Linux 主机上程序获取(域名对应的) IP 地址的过程及期间涉及的组件进行分块剖析。如果不理解这些块的协同工作方式,调试解决 dnsmasq
、vagrant landrush
和 resolvconf
等相关的问题会让人感到眼花缭乱。
同时这也是一份有价值的说明,指出原本很简单的东西是如何随着时间的推移变得相当复杂。在弄清楚 DNS 查询的原理的过程中,我了解了大量不同的技术及其发展历程。
我甚至编写了一些自动化脚本,可以让我在虚拟机中进行实验。欢迎读者参与贡献或勘误。
请注意,本系列主题并不是“DNS 工作原理”,而是与查询 Linux 主机配置的真实 DNS 服务器(这里假设查询了一台 DNS 服务器,但后面你会看到有时并不需要)相关的内容,以及如何确定使用哪个查询结果,或者如何使用其它方式确定 IP 地址。
1) 其实并没有名为“DNS 查询”的系统调用
工作方式并非如此
首先要了解的一点是,Linux 上并没有一个单独的方法可以完成 DNS 查询工作;没有一个有这样的明确接口的核心 系统调用 。
不过,有一个标准 C 库函数调用 getaddrinfo
,不少程序使用了该调用;但不是所有程序或应用都使用该调用!
让我们看一下两个简单的标准程序:ping
和 host
:
1 |
|
1 |
|
对于同一个域名,两个程序得到的 IP 地址是相同的;那么它们是使用同样的方法得到结果的吧?
事实并非如此。
下面文件给出了我主机上 ping
对应的 DNS 相关的系统调用:
1 |
|
下面是 host
对应的系统调用:
1 |
|
可以看出 ping
打开了 nsswitch.conf
文件,但 host
没有;但两个程序都打开了 /etc/resolv.conf
文件。
下面我们依次查看这两个 .conf
扩展名的文件。
2) NSSwitch 与 /etc/nsswitch.conf
我们已经确认应用可以自主决定选用哪个 DNS 服务器。很多应用(例如 ping
)通过配置文件 /etc/nsswitch.conf
(根据具体实现 1 )参考 NSSwitch 完成选择。
NSSwitch 不仅用于 DNS 查询,例如,还用于密码与用户信息查询。
NSSwitch 最初是 Solaris OS 的一部分,可以让应用无需硬编码查询所需的文件或服务,而是在其它集中式的、无需应用开发人员管理的配置文件中找到。
下面是我的 nsswitch.conf
:
1 |
|
我们需要关注的是 hosts
行。我们知道 ping
用到 nsswitch.conf
文件,那么我们修改这个文件(的 hosts
行),看看能够如何影响 ping
。
修改 nsswitch.conf
, hosts
行仅保留 files
如果你修改 nsswitch.conf
,将 hosts
行仅保留 files
:
1 |
|
此时, ping
无法获取 google.com 对应的 IP 地址:
1 |
|
但 localhost
的解析不受影响:
1 |
|
此外,host
命令正常返回:
1 |
|
毕竟如我们之前看到的那样,host
不受 nsswitch.conf
影响。
修改 nsswitch.conf
, hosts
行仅保留 dns
如果你修改 nsswitch.conf
,将 hosts
行仅保留 dns
:
1 |
|
此时,google.com 的解析恢复正常:
1 |
|
但 localhost
无法解析:
1 |
|
下图给出默认 NSSwitch 中 hosts
行对应的查询逻辑:
我的 hosts:
配置是 nsswitch.conf
给出的默认值
3) /etc/resolv.conf
我们已经知道 host
和 ping
都使用 /etc/resolv.conf
文件。
下面给出我主机的 /etc/resolv.conf
文件内容:
1 |
|
先忽略前两行,后面我们会回过头来看这部分(它们很重要,但你还需要一些知识储备)。
其中 nameserver
行指定了查询用到的 DNS 服务器。
如果将该行注释掉:
1 |
|
再次运行:
1 |
|
解析失败了,这是因为没有可用的名字服务器 2 。
该文件中还可以使用其它选项。例如,你可以在 resolv.conf
文件中增加如下行:
1 |
|
然后执行 ping google
(不写 .com
)
1 |
|
程序会自动为你尝试 .com
域。
第一部分总结
第一部分到此结束,下一部分我们会了解 resolv.conf
文件是如何创建和更新的。
下面总结第一部分涵盖的内容:
- 操作系统中并不存在“DNS 查询”这个系统调用
- 不同程序可能采用不同的策略获取名字对应的 IP 地址
- 例如,
ping
使用nsswitch
,后者进而使用(或可以使用)/etc/hosts
、/etc/resolv.conf
以及主机名得到解析结果
- 例如,
/etc/resolv.conf
用于决定:- 查询什么地址(LCTT 译注:这里可能指
search
带来的影响) - 使用什么 DNS 服务器执行查询
- 查询什么地址(LCTT 译注:这里可能指
如果你曾认为 DNS 查询很复杂,请跟随这个系列学习吧。
via: https://zwischenzugs.com/2018/06/08/anatomy-of-a-linux-dns-lookup-part-i/
作者:ZWISCHENZUGS 译者:pinewall 校对:wxy