要找出机器人的来源并阻止它们,您将需要机器人被发送到的 IP 地址或它们的用户代理字符串。 IP 地址是唯一的,用于识别互联网上的每台计算机。相比之下,用户代理字符串是实际程序的名称。例如,Google 搜索引擎机器人会通过 Googlebot/2.1。
1. 访问您的日志
要找到其中任何一项,您需要访问原始网络日志。在 LWS 上,您可以 阿根廷电话号码数据 在客户区域找到您的原始网络日志。下载当前的原始访问日志。这些文件通常非常大,需要使用归档器进行解压。您可以在网络或应用商店中找到许多版本的归档器。文件解压后,用 ASCII 文本编辑器(如记事本)打开它,也可以在网上找到。
尝试找到您想要阻止的机器人。一些标识符可以让您知道机器人尝试访问您的网站的时间。利用这些信息中的任何一条,您都应该能够找到 IP 地址或用户代理字符串。找到这两条信息后,将它们写下来并为下一步做准备。
下一步是阻止 IP 地址或用户代理字符串。然而,这可能会对您的业务产生不利影响。机器人来自一个 IP 地址并不意味着它们下次攻击时会来自同一个 IP 地址。 通过随机阻止 IP 地址,您很可能会阻止整个互联网服务提供商(ISP)。阻止某些用户代理字符串也会出现同样的风险。黑客很聪明,通常会用他们使用的软件或浏览器的名称来命名他们的机器人。例如,当您尝试阻止名为“Safari”的机器人时,这就会成为问题。事实上,这可以立即阻止该网络浏览器的所有用户。
2. 编辑 .htaccess 文件
如果您仍然认为此解决方案值得,下一步就是上传您的.htaccess 文件。
对 .htaccess 文件的不当更改可能会损坏您的网站。在进行任何进一步的更改之前,请确保备份您的网站。要上传您的 .htaccess 文件,请从您的控制面板转到您网站的网络目录,然后找到名为“.htaccess”的文件。如果您找不到该文件,则它可能不存在,您需要创建一个。