MySQL如何有效的存储IP地址

2020-05-30 16:02:34来源：博客园阅读 ()

MySQL如何有效的存储IP地址

当存储IPv4地址时，应该使用32位的无符号整数（UNSIGNED INT）来存储IP地址

前几天，阿淼的一个朋友去面试，他回来告诉我，面试官问他 IP 地址是怎么存在数据库的？他当时也没多想，直接就回答的存字符串啊（心想：这么简单的问题，怕不是看不起我吧）

前面这段权当看看，毕竟 IP地址本来就是一个字符串，存放在数据库作为字符穿类型，也是无可厚非的。但是，阿淼我可是一个喜欢换位思考的人，站在面试官的角度，你觉得我会问这么一个低级的问题么？那么档案当然是否定的。所以，面试官想知道的是你对这个问题会不会有深度思考，从此来一定程度的判断你在平常的开发中只是一个单纯的 "搬砖" 的码农，还是一个有灵魂的 Coder 。

序言

针对这个问题，首先声明一下，将 IP地址以字符串的形式保存在数据库是完全没问题的。那么你可能就有疑问了？既然没问题，那你还在这里瞎比比什么呢？

虽然，这是一个前后矛盾的话题，但是除了存字符串以外，我们还有其他的存储方式。例如比较常用的，将 IP地址存成 int 型的数据，这种存储方式虽然实现起来不复杂，但是能想到该方法，也从一定程度上表明了你是一个善于思考，对数据底层基础把握的比较到位。

因为一个 int 型的数据占 4 个字节，每个字节 8 位，其范围就是 0~(2^8-1)，而 ipv4地址可以分成4段，每段的范围是 0~255 刚刚好能存下，所以将其稍稍转换，就巧妙的将 IP地址用最小的空间存在了数据库中（接下来的描述若无特殊说明，则都是指的 ipv4地址）。可能你会觉得这个小小的改变没有什么关系，但是当数据量越来越多的时候，15个字节和4个字节相差的数据量会让你吃惊。所以在设计数据库的时候，字段类型用合适的，够用就行，能省则省。

正如在《高性能MySQL 第3版》第4.1.7节时，作者建议当存储IPv4地址时，应该使用32位的无符号整数（UNSIGNED INT）来存储IP地址，而不是使用字符串的原理一样。

相对字符串存储，使用无符号整数来存储有如下的好处：

节省空间，不管是数据存储空间，还是索引存储空间
便于使用范围查询（BETWEEN...AND），且效率更高

通常，在保存IPv4地址时，一个IPv4最小需要7个字符，最大需要15个字符，所以，使用VARCHAR(15)即可。MySQL在保存变长的字符串时，还需要额外的一个字节来保存此字符串的长度。而如果使用无符号整数来存储，只需要4个字节即可。另外还可以使用4个字段分别存储IPv4中的各部分，但是通常这不管是存储空间和查询效率应该都不是很高（虽然有的场景适合使用这种方式存储）。不过使用无符号整数来存储也有不便于阅读和需要手动转换的缺点。

工具类实现转换

而要实现将IP地址存储成 int 型保存在数据库中，一种是通过java代码中的 移位操作 和 & 计算得到相应的值：

package com.java.mmzsit;

/**
 * @author ：mmzsblog
 * @description：Ipv4地址的转换
 * @date ：2020/5/27 22:43
 */
public class Ipv4Covert {
    public static void main(String[] args) {
        String ip = "10.108.149.219";

        // step1: 分解IP字符串，并对应写对字节数组
        byte[] ip1 = ipToBytes(ip);

        // step2: 对字节数组里的每个字节进行左移位处理，分别对应到整型变量的4个字节
        int ip2 = bytesToInt(ip1);
        System.out.println("整型ip ----> " + ip2);

        // step3: 对整型变量进行右位移处理，恢复IP字符串
        String ip3 = intToIp(ip2);
        System.out.println("字符串ip---->" + ip3);

    }

    
    /**
     * 把IP地址转化为int
     * @param ipAddr
     * @return int
     */
    public static byte[] ipToBytesByReg(String ipAddr) {
        byte[] ret = new byte[4];
        try {
            String[] ipArr = ipAddr.split("\\.");
            ret[0] = (byte) (Integer.parseInt(ipArr[0]) & 0xFF);
            ret[1] = (byte) (Integer.parseInt(ipArr[1]) & 0xFF);
            ret[2] = (byte) (Integer.parseInt(ipArr[2]) & 0xFF);
            ret[3] = (byte) (Integer.parseInt(ipArr[3]) & 0xFF);
            return ret;
        } catch (Exception e) {
            throw new IllegalArgumentException(ipAddr + " is invalid IP");
        }

    }



    /**
     * 第一步，把IP地址分解为一个btye数组
     */
    public static byte[] ipToBytes(String ipAddr) {
        // 初始化字节数组，定义长度为4
        byte[] ret = new byte[4];
        try {
            String[] ipArr = ipAddr.split("\\.");
            // 将字符串数组依次写入字节数组
            ret[0] = (byte) (Integer.parseInt(ipArr[0]));
            ret[1] = (byte) (Integer.parseInt(ipArr[1]));
            ret[2] = (byte) (Integer.parseInt(ipArr[2]));
            ret[3] = (byte) (Integer.parseInt(ipArr[3]));
            return ret;
        } catch (Exception e) {
            throw new IllegalArgumentException("invalid IP : " + ipAddr);
        }
    }

    /**
     * 根据位运算把 byte[] -> int
     * 原理：将每个字节强制转化为8位二进制码，然后依次左移8位，对应到Int变量的4个字节中
     */
    public static int bytesToInt(byte[] bytes) {
        // 先移位后直接强转的同时指定位数
        int addr = bytes[3] & 0xFF;
        addr |= ((bytes[2] << 8) & 0xFF00);
        addr |= ((bytes[1] << 16) & 0xFF0000);
        addr |= ((bytes[0] << 24) & 0xFF000000);
        return addr;
    }

    /**
     * 把int->string地址
     *
     * @param ipInt
     * @return String
     */
    public static String intToIp(int ipInt) {
        // 先强转二进制，再进行移位处理
        return new StringBuilder()
                // 右移3个字节（24位），得到IP地址的第一段也就是byte[0],为了防止符号位是1也就是负数，最后再一次& 0xFF
                .append(((ipInt & 0xFF000000) >> 24) & 0xFF).append('.')
                .append((ipInt & 0xFF0000) >> 16).append('.')
                .append((ipInt & 0xFF00) >> 8).append('.')
                .append((ipInt & 0xFF))
                .toString();
    }
}

其实这是一种二进制的思维，也是计算技术中广泛采用的一种数制，虽然平时用的不多，但是熟练掌握后，有助于加强我们对机器语言的理解和提升我们的编码水平，特别是面对资源紧张（运存）的场景时，有助于我们分析和优化问题。

数据库函数实现转换

另一种方式就是通过数据库自带的函数 INET_ATON 和 INET_NTOA 进行转化：

mysql> SELECT INET_ATON('192.168.0.1');
+--------------------------+
| INET_ATON('192.168.0.1') |
+--------------------------+
|               3232235521 |
+--------------------------+
1 row in set

mysql> SELECT INET_NTOA(3232235521);  
+-----------------------+
| INET_NTOA(3232235521) |
+-----------------------+
| 192.168.0.1           |
+-----------------------+
1 row in set

如果是 IPv6地址的话，则使用函数 INET6_ATON 和 INET6_NTOA 进行转化：

mysql> SELECT HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B')); 

+----------------------------------------------+
| HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B')) |
+----------------------------------------------+
| 1030000000000000C9B4FF1248AA1A2B             |
+----------------------------------------------+
1 row in set

mysql> SELECT INET6_NTOA(UNHEX('1030000000000000C9B4FF1248AA1A2B')); 
+-------------------------------------------------------+
| INET6_NTOA(UNHEX('1030000000000000C9B4FF1248AA1A2B')) |
+-------------------------------------------------------+
| 1030::c9b4:ff12:48aa:1a2b                             |
+-------------------------------------------------------+
1 row in set

然后数据库定义为 varbinary 类型，分配 128bits 空间（因为 ipv6采用的是128bits，16个字节）；或者定义为 char 类型，分配 32bits 空间。

用数据库的函数的话，只需要在 IP地址入库时，稍稍做一下转换即可，方便快捷；而且到了这里，你不觉得将 IP地址转换成数字存储是一种不错的选择么，毕竟数据库都帮我们考虑到了这一点，也间接性的证明了这的确是一种可行、并且不错的存储方式。

参考

1、如何把IP地址保存到Int类型变量中https://www.jianshu.com/p/1090044c3522
2、论IP地址在数据库中应该用何种形式存储https://www.cnblogs.com/skynet/archive/2011/01/09/1931044.html
3、存储整数IP地址的MySQL性能优势https://bafford.com/2009/03/09/mysql-performance-benefits-of-storing-integer-ip-addresses/

原文链接:https://www.cnblogs.com/mmzs/p/12992560.html
如有疑问请与原作者联系

标签：

版权申明：本站文章部分自网络，如有侵权，请联系：west999com@outlook.com
特别注意：本站所有转载文章言论不代表本站观点，本站所提供的摄影照片，插画，设计作品，如需使用，请与原作者联系，版权归原作者所有