视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
python使用正则搜索字符串或文件中的浮点数代码实例
2020-11-27 14:30:36 责编:小采
文档


用python和numpy处理数据次数比较多,写了几个小函数,可以方便地读写数据:

# -*- coding: utf-8 -*-
#----------------------------------------------------------------------
# FileName:gettxtdata.py
#功能:读取字符串和文件中的数值数据(浮点数)
#主要提供类似matlab中的dlmread和dlmwrite函数
#同时提供loadtxtdata和savetxtdata函数
#Data: 2013-1-10
#Author:吴徐平
#----------------------------------------------------------------------
import numpy
#----------------------------------------------------------------------
def StringToDoubleArray(String):
 """
 #将字符串中的所有非Double类型的字符全部替换成空格
 #以'#'开头注释直至行尾,都被清空
 #返回一维numpy.array数组

 """ 
 from StringIO import StringIO
 import re
 
 DataArray=numpy.empty([0],numpy.float)

 if len(String.strip())>0:
 #清空注释行,都是以'#'开头子字符
 doublestring=re.sub('#.*$', " ", String, count=0, flags=re.IGNORECASE)
 #删除非数字字符 
 doublestring=re.sub('[^0-9.e+-]', " ", doublestring, count=0, flags=re.IGNORECASE)
 #去掉不正确的数字格式(代码重复是有必要的)
 doublestring=re.sub('[.e+-](?=s)', " ", doublestring, count=0, flags=re.IGNORECASE)
 doublestring=re.sub('[.e+-](?=s)', " ", doublestring, count=0, flags=re.IGNORECASE)
 doublestring=re.sub('[e+-]$', " ", doublestring, count=0, flags=re.IGNORECASE)
 doublestring=re.sub('[e+-]$', " ", doublestring, count=0, flags=re.IGNORECASE)
 #去掉首尾空格
 doublestring=doublestring.strip()
 if len(doublestring)>0:
 StrIOds=StringIO(doublestring)
 DataArray= numpy.genfromtxt(StrIOds)
 
 return DataArray

#----------------------------------------------------------------------
def GetDoubleListFromString(String):
 """
 #使用换行符分割字符串
 #将字符串中的所有非Double类型的字符全部替换成空格
 #以'#'开头注释直至行尾,都被清空
 #将每一行转换成numpy.array数组
 #返回numpy.array数组的列表

 """ 
 from StringIO import StringIO
 import re
 
 DoubleList=[]
 StringList=String.split('
')#使用换行符分割字符串
 for Line in StringList:
 if len(Line.strip())>0:
 #清空注释行,都是以'#'开头子字符
 doublestring=re.sub('#.*$', " ", Line, count=0, flags=re.IGNORECASE)
 #删除非数字字符 
 doublestring=re.sub('[^0-9.e+-]', " ", doublestring, count=0, flags=re.IGNORECASE)
 #去掉不正确的数字格式(代码重复是有必要的)
 doublestring=re.sub('[.e+-](?=s)', " ", doublestring, count=0, flags=re.IGNORECASE)
 doublestring=re.sub('[.e+-](?=s)', " ", doublestring, count=0, flags=re.IGNORECASE)
 doublestring=re.sub('[e+-]$', " ", doublestring, count=0, flags=re.IGNORECASE)
 doublestring=re.sub('[e+-]$', " ", doublestring, count=0, flags=re.IGNORECASE)
 #去掉首尾空格
 doublestring=doublestring.strip()
 if len(doublestring)>0:
 StrIOds=StringIO(doublestring)
 DoubleList.append(numpy.genfromtxt(StrIOds)) 
 return DoubleList
 
#----------------------------------------------------------------------
def GetDoubleListFromFile(FileName):
 """
 #将文本文件中的所有Double类型的字符全部替换成numpy.array数组
 #每一行都是numpy.array数组
 ##返回numpy.array数组的列表
 #注意:返回列表的每个元素又都是一个numpy.array数组
 #注意:返回列表的每个元素(或文件每行)可以包含不同多个数的数字

 """ 
 file=open(FileName, 'r')
 read_file = file.read()
 file.close() 
 DoubleList=GetDoubleListFromString(read_file)
 return DoubleList

def dlmread(FileName,dtype=numpy.float):
 """
 #Load Data From Txt-File.
 #分隔符默认是:";",",",空格类 (包括	)等等
 #以#开头的被认为是注释,不会被读取
 #Return Value:二维数值数组(numpy.ndarray)
 #对文本中数据的排列格式要求最低,且容许出现注释字符,智能化程度最高,但速度较慢
 """
 DoubleList=GetDoubleListFromFile(FileName)
 dlsize=[]#每一行数组的大小
 for dL in DoubleList:
 dlsize.append(dL.size)
 
 MinColumnSize=min(dlsize)#数组的最大列数
 MaxColumnSize=max(dlsize)#数组的最小列数
 #数组创建和赋值
 DoubleArray=numpy.empty([len(DoubleList),MinColumnSize],dtype=dtype)
 
 row=range(0,len(DoubleList))
 colum=range(0,MinColumnSize)
 
 for i in row:
 for j in colum:
 DoubleArray[i][j]=DoubleList[i][j] 
 
 return DoubleArray
#----------------------------------------------------------------------

def loadtxtdata(filename,delimiter=""):
 """
 #Load Data From Txt-File with delimiter.
 #分隔符默认是:";",",",空格类 (包括	)和自定义的delimiter等
 #Return Value: 二维数值数组(numpy.ndarray)
 #对文本中数据的排列格式要求较高,且不容许出现注释字符,智能化程度较低,但速度较快
 """
 from StringIO import StringIO
 import re
 
 file_handle=open(filename,'r')
 LinesALL=file_handle.read()#读入字符串
 file_handle.close()
 
 DelimiterALL=delimiter+",;"#分隔符
 SpaceString=" "#空格
 for RChar in DelimiterALL:
 LinesALL=LinesALL.replace(RChar,SpaceString)
 
 return numpy.genfromtxt(StringIO(LinesALL))
 
#---------------------------------------------------------------------- 
def savetxtdata(filename, X, fmt='%.8e', delimiter=' ', newline='
'):
 """
 Save Data To Txt-File.
 """
 numpy.savetxt(filename, X, fmt=fmt, delimiter=delimiter, newline=newline) 
 return True
 
#----------------------------------------------------------------------
def dlmwrite(filename, X, fmt='%.8e', delimiter=' ', newline='
'):
 """
 Save Data To Txt-File.
 """
 numpy.savetxt(filename, X, fmt=fmt, delimiter=delimiter, newline=newline) 
 return True
 
#----------------------------------------------------------------------
#测试程序 
#----------------------------------------------------------------------
if __name__ == '__main__':
 #生成随机数
 data=numpy.random.randn(3,4)
 filename='D:/x.txt'
 #写入文件
 dlmwrite(filename,data)
 x=GetDoubleListFromFile(filename)
 print(x)
 print(dlmread(filename))
 y=StringToDoubleArray('79l0joj')
 print(y)
 z=loadtxtdata(filename)
 print(z)

我只在python2.7中试过,如果要在python3.x中使用,可自行测试.

下载本文
显示全文
专题