NumPy 字符串函数

以下函数用于对 dtype 为 numpy.string_ 或 numpy.unicode_ 的数组执行向量化字符串操作。 它们基于 Python 内置库中的标准字符串函数。

这些函数在字符数组类(numpy.char)中定义。

函数描述
add()对两个数组的逐个字符串元素进行连接
multiply()返回按元素多重连接后的字符串
center()居中字符串
capitalize()将字符串第一个字母转换为大写
title()将字符串的每个单词的第一个字母转换为大写
lower()数组元素转换为小写
upper()数组元素转换为大写
split()指定分隔符对字符串进行分割,并返回数组列表
splitlines()返回元素中的行列表,以换行符分割
strip()移除元素开头或者结尾处的特定字符
join()通过指定分隔符来连接数组中的元素
replace()使用新字符串替换字符串中的所有子字符串
decode()数组元素依次调用str.decode
encode()数组元素依次调用str.encode

numpy.char.add()

numpy.char.add() 函数依次对两个数组的元素进行字符串连接。

实例

import numpy as np 
 
print ('连接两个字符串:')
print (np.char.add(['hello'],[' xyz']))
print ('\n')
 
print ('连接示例:')
print (np.char.add(['hello', 'hi'],[' abc', ' xyz']))

输出结果为:

连接两个字符串:
['hello xyz']

连接示例:
['hello abc' 'hi xyz']

numpy.char.multiply()

numpy.char.multiply() 函数执行多重连接。

实例

import numpy as np 
 
print (np.char.multiply('Runoops',3))

输出结果为:

Runoops Runoops Runoops

numpy.char.center()

numpy.char.center() 函数用于将字符串居中,并使用指定字符在左侧和右侧进行填充。

实例

import numpy as np 
 
# np.char.center(str , width,fillchar) :
# str: 字符串,width: 长度,fillchar: 填充字符
print (np.char.center('Runoops', 20,fillchar = '*'))

输出结果为:

*******Runoops*******

numpy.char.capitalize()

numpy.char.capitalize() 函数将字符串的第一个字母转换为大写:

实例

import numpy as np 
 
print (np.char.capitalize('runoops'))

输出结果为:

Runoops

numpy.char.title()

numpy.char.title() 函数将字符串的每个单词的第一个字母转换为大写:

实例

import numpy as np
 
print (np.char.title('i like runoops'))

输出结果为:

I Like Runoops

numpy.char.lower()

numpy.char.lower() 函数对数组的每个元素转换为小写。它对每个元素调用 str.lower。

实例

import numpy as np 
 
#操作数组
print (np.char.lower(['RUNOOPS','GOOGLE']))
 
# 操作字符串
print (np.char.lower('RUNOOPS'))

输出结果为:

['runoops' 'google']
runoops

numpy.char.upper()

numpy.char.upper() 函数对数组的每个元素转换为大写。它对每个元素调用 str.upper。

实例

import numpy as np 
 
#操作数组
print (np.char.upper(['runoops','google']))
 
# 操作字符串
print (np.char.upper('runoops'))

输出结果为:

['RUNOOPS' 'GOOGLE']
RUNOOPS

numpy.char.split()

numpy.char.split() 通过指定分隔符对字符串进行分割,并返回数组。默认情况下,分隔符为空格。

实例

import numpy as np 
 
# 分隔符默认为空格
print (np.char.split ('i like runoops?'))
# 分隔符为 .
print (np.char.split ('www.runoops.com', sep = '.'))

输出结果为:

['i', 'like', 'runoops?']
['www', 'runoops', 'com']

numpy.char.splitlines()

numpy.char.splitlines() 函数以换行符作为分隔符来分割字符串,并返回数组。

实例

import numpy as np 
 
# 换行符 \n
print (np.char.splitlines('i\nlike runoops?')) 
print (np.char.splitlines('i\rlike runoops?'))

输出结果为:

['i', 'like runoops?']
['i', 'like runoops?']

\n\r\r\n 都可用作换行符。

numpy.char.strip()

numpy.char.strip() 函数用于移除开头或结尾处的特定字符。

实例

import numpy as np 
 
# 移除字符串头尾的 a 字符
print (np.char.strip('ashok arunoopsa','a'))
 
# 移除数组元素头尾的 a 字符
print (np.char.strip(['arunoopsa','admin','java'],'a'))

输出结果为:

shok arunoops
['runoops' 'dmin' 'jav']

numpy.char.join()

numpy.char.join() 函数通过指定分隔符来连接数组中的元素或字符串

实例

import numpy as np 
 
# 操作字符串
print (np.char.join(':','runoops'))
 
# 指定多个分隔符操作数组元素
print (np.char.join([':','-'],['runoops','google']))

输出结果为:

r:u:n:o:o:p:s
['r:u:n:o:o:p:s' 'g-o-o-g-l-e']

numpy.char.replace()

numpy.char.replace() 函数使用新字符串替换字符串中的所有子字符串。

实例

import numpy as np 
 
print (np.char.replace ('i like runoops', 'oo', 'cc'))

输出结果为:

i like runccps

numpy.char.encode()

numpy.char.encode() 函数对数组中的每个元素调用 str.encode 函数。 默认编码是 utf-8,可以使用标准 Python 库中的编解码器。

实例

import numpy as np 
 
a = np.char.encode('runoops', 'cp500') 
print (a)

输出结果为:

b'\x99\xa4\x95\x96\x96\x97\xa2'

numpy.char.decode()

numpy.char.decode() 函数对编码的元素进行 str.decode() 解码。

实例

import numpy as np 
 
a = np.char.encode('runoops', 'cp500') 
print (a)
print (np.char.decode(a,'cp500'))

输出结果为:

b'\x99\xa4\x95\x96\x96\x97\xa2'
runoops