📂 目录

  • 字符串函数概述
  • 常用字符串函数
  • 字符串数组的应用
  • 出站链接
  • 参考资料

🎯 字符串函数概述

NumPy 提供了一些处理字符串数组的功能,允许你高效地对字符串数据进行操作。字符串函数(np.char 模块)支持许多常见的字符串操作,如大小写转换、查找、替换等。

使用 np.char 模块时,数组中的每个元素将作为独立的字符串进行处理,且所有操作都向量化,以实现高效的批量处理。


🧑‍🏫 常用字符串函数

  1. np.char.upper() – 将字符串数组中的每个字符串转换为大写: arr = np.array(['apple', 'banana', 'cherry']) print(np.char.upper(arr)) # 输出:['APPLE' 'BANANA' 'CHERRY']
  2. np.char.lower() – 将字符串数组中的每个字符串转换为小写: arr = np.array(['APPLE', 'BANANA', 'CHERRY']) print(np.char.lower(arr)) # 输出:['apple' 'banana' 'cherry']
  3. np.char.capitalize() – 将每个字符串的第一个字母大写: arr = np.array(['apple', 'banana', 'cherry']) print(np.char.capitalize(arr)) # 输出:['Apple' 'Banana' 'Cherry']
  4. np.char.strip() – 去除字符串中的前后空格: arr = np.array([' apple ', ' banana ', ' cherry ']) print(np.char.strip(arr)) # 输出:['apple' 'banana' 'cherry']
  5. np.char.replace() – 替换字符串中的子串: arr = np.array(['apple', 'banana', 'cherry']) print(np.char.replace(arr, 'a', 'o')) # 输出:['opple' 'bonono' 'cherry']
  6. np.char.split() – 按指定字符拆分字符串: arr = np.array(['apple orange', 'banana grape', 'cherry pineapple']) print(np.char.split(arr)) # 输出:[list(['apple', 'orange']) list(['banana', 'grape']) list(['cherry', 'pineapple'])]
  7. np.char.find() – 查找子字符串的位置,如果找不到返回 -1: arr = np.array(['apple', 'banana', 'cherry']) print(np.char.find(arr, 'a')) # 输出:[0 1 2]
  8. np.char.count() – 统计子字符串出现的次数: arr = np.array(['apple', 'banana', 'cherry']) print(np.char.count(arr, 'a')) # 输出:[1 3 1]

🧑‍🏫 字符串数组的应用

np.char 模块通常用于处理文本数据,尤其在数据清洗、文本分析和数据预处理时非常有用。例如,你可以使用它来清理并标准化大量文本数据。

arr = np.array(['  Hello  ', '  World  ', '  NumPy  '])
cleaned_arr = np.char.strip(arr)  # 去除空格
capitalized_arr = np.char.upper(cleaned_arr)  # 转换为大写
print(capitalized_arr)
# 输出:['HELLO' 'WORLD' 'NUMPY']


🔗 出站链接


📚 参考资料

  • NumPy 官方文档
  • W3Schools Python NumPy 教程
  • GeeksForGeeks 深度讲解
  • 来自:www.52kanjuqing.com