视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
python访问纯真IP数据库的代码
2020-11-27 14:39:11 责编:小采
文档


核心代码:

#!/usr/bin/env python 
# -*- coding: utf-8 -*- 

from bisect import bisect 

_LIST1, _LIST2 = [], [] 
_INIT = False 

ip2int = lambda ip_str: reduce(lambda a, b: (a << 8) + b, [int(i) for i in ip_str.split('.')]) 

def _init(): 
global _LIST, _INIT 
if not _INIT: 
for l in open('ipdata.txt', 'rb'): 
ip1, ip2 = l.split()[:2] 
addr = ' '.join(l.split()[2:]) 
ip1, ip2 = ip2int(ip1), ip2int(ip2) 
_LIST1.append(ip1) 
_LIST2.append((ip1, ip2, addr)) 
_INIT = True 

def ip_from(ip): 
_init() 
i = ip2int(ip) 
idx = bisect(_LIST1, i) 
assert(idx > 0) 
if len(_LIST1) <= idx: 
return u'unknown ip address %s' % ip 
else: 
frm, to ,addr = _LIST2[idx - 1] 
if frm <= i <= to: 
return addr 
else: 
return u'unknown ip address %s' % ip 

if __name__ == '__main__': 
print ip_from('115.238.54.106') 
print ip_from('220.181.29.160') 
print ip_from('115.238.54.107') 
print ip_from('8.8.8.8')

代码打包下载 http://xiazai.bitsCN.com/201105/yuanma/ipaddress.7z

接下来为大家分享更完美的代码:

#!/usr/bin/env python
# coding: utf-8
 
'''用Python脚本查询纯真IP库
 
QQWry.Dat的格式如下:
 
+----------+
| 文件头 | (8字节)
+----------+
| 记录区 | (不定长)
+----------+
| 索引区 | (大小由文件头决定)
+----------+
 
文件头:4字节开始索引偏移值+4字节结尾索引偏移值
 
记录区: 每条IP记录格式 ==> IP地址[国家信息][地区信息]
 
 对于国家记录,可以有三种表示方式:
 
 字符串形式(IP记录第5字节不等于0x01和0x02的情况),
 重定向模式1(第5字节为0x01),则接下来3字节为国家信息存储地的偏移值
 重定向模式(第5字节为0x02),
 
 对于地区记录,可以有两种表示方式: 字符串形式和重定向
 
 最后一条规则:重定向模式1的国家记录后不能跟地区记录
 
索引区: 每条索引记录格式 ==> 4字节起始IP地址 + 3字节指向IP记录的偏移值
 
 索引区的IP和它指向的记录区一条记录中的IP构成一个IP范围。查询信息是这个
 范围内IP的信息
 
'''
 
import sys
import socket
from struct import pack, unpack
 
class IPInfo(object):
 '''QQWry.Dat数据库查询功能集合
 '''
 def __init__(self, dbname):
 ''' 初始化类,读取数据库内容为一个字符串,
 通过开始8字节确定数据库的索引信息'''
 
 self.dbname = dbname
 # f = file(dbname, 'r')
 
 # Demon注:在Windows下用'r'会有问题,会把
转换成

 # 详见http://demon.tw/programming/python-open-mode.html
 # 还有Python文档中不提倡用file函数来打开文件,推荐用open
 f = open(dbname, 'rb')
 
 self.img = f.read()
 f.close()
 
 # QQWry.Dat文件的开始8字节是索引信息,前4字节是开始索引的偏移值,
 # 后4字节是结束索引的偏移值。
 # (self.firstIndex, self.lastIndex) = unpack('II', self.img[:8])
 
 # Demon注:unpack默认使用的endian是和机器有关的
 # Intel x86和AMD(x86-)是little-endian
 # Motorola 68000和PowerPC G5是big-endian
 # 而纯真数据库全部采用了little-endian字节序
 # 所以在某些big-endian的机器上原代码会出错
 (self.firstIndex, self.lastIndex) = unpack('