处理字符串
Nushell 中的字符串用于保存文本数据以便后续使用,其中可以包括文件名、文件路径、列名以及更多。字符串是如此地普遍,以至于 Nushell 提供了几种处理它们的方法,你可以从中选择最合适的。
字符串格式一览
字符串格式 | 示例 | 转义字符 | 说明 |
---|---|---|---|
单引号字符串 | '[^\n]+' | 无 | 字符串内不能包含单引号 |
双引号字符串 | "The\nEnd" | C风格反斜杠转义 | 所有字面反斜杠都必须转义 |
原始字符串 | r#'Raw string'# | 无 | 可以包含单引号 |
裸词字符串 | ozymandias | 无 | 只能包含"单词"字符;不能在命令位置使用 |
反引号字符串 | `[^\n]+` | 无 | 可以包含空格的裸字符串。不能包含任何反引号 |
单引号插值 | $'Captain ($name)' | 无 | 不能包含任何 ' 或不匹配的 () |
双引号插值 | $"Captain ($name)" | C风格反斜杠转义 | 所有字面反斜杠和 () 都必须转义 |
单引号字符串
Nushell 中最简单的字符串是单引号字符串。这种字符串使用'
字符来包裹文本。下面是作为单引号字符串的hello world
示例:
'hello world'
# => hello world
单引号字符串不会对它们所给予的文本做任何事情,这使得它们成为容纳广泛文本数据的理想选择。
双引号字符串
对于更复杂的字符串,Nushell 也提供双引号字符串。这些字符串使用"
字符来包裹文本。它们还支持使用\
字符在文本中转义。
例如,我们可以用转义字符和双引号字符串写出文字 hello,然后换行,再写上 world:
"hello\nworld"
# => hello
# => world
转义字符让你快速添加一个非此难以输入的字符。
Nushell 目前支持以下转义字符:
\"
- 双引号\'
- 单引号\\
- 反斜杠\/
- 斜杠\b
- 退格字符\f
- 换页符\r
- 回车符\n
- 换行符 (line feed)\t
- 制表符\u{X...}
- Unicode 字符, 其中 X...为 1 到 6 位的十六进制数字
原始字符串(Raw Strings)
原始字符串的行为与单引号字符串相同,不同之处在于原始字符串也可以包含单引号。这是可能的,因为原始字符串由起始的r#'
和结束的'#
包围。这种语法对Rust用户来说应该很熟悉。
r#'原始字符串可以包含'引号'文本'#
# => 原始字符串可以包含'引号'文本
可以在原始字符串的开始和结束处添加额外的#
符号来包围字符串中比'
符号少一个的相同数量的#
符号。这可以用来嵌套原始字符串:
r###'r##'这是一个原始字符串的例子'##'###
# => r##'这是一个原始字符串的例子'##
裸词字符串(Bare Word Strings)
像其他shell语言(但与大多数其他编程语言不同)一样,由单个'词'组成的字符串也可以不加任何引号:
print hello
# => hello
[hello] | describe
# => list<string>
但要小心 - 如果在命令行上直接使用裸词(即不在数据结构中或作为命令参数使用)或在圆括号(
)
内,它将被解释为外部命令:
hello
# => Error: nu::shell::external_command
# =>
# => × External command failed
# => ╭─[entry #5:1:1]
# => 1 │ hello
# => · ──┬──
# => · ╰── executable was not found
# => ╰────
# => help: program not found
此外,许多裸词在nu中有特殊含义,因此不会被解释为字符串:
true | describe
# => bool
[true] | describe
# => list<bool>
[trueX] | describe
# => list<string>
trueX | describe
# => Error: nu::shell::external_command
# =>
# => × External command failed
# => ╭─[entry #5:1:1]
# => 1 │ trueX | describe
# => · ──┬──
# => · ╰── executable was not found
# => ╰────
# => help: program not found
反引号字符串(Backtick-quoted Strings)
裸词字符串本质上不能包含空格或引号。作为替代方案,Nushell还包括使用`
字符的反引号字符串。在大多数情况下,这些应该与裸词字符串的操作方式相同。
例如,与裸词一样,表达式第一个位置的反引号字符串将被解释为命令或路径。例如:
# 运行路径中找到的外部ls二进制文件
`ls`
# 向上移动一个目录
`..`
# 切换到"my dir"子目录(如果存在)
`./my dir`
反引号字符串对于将glob与包含空格的文件或目录组合很有用:
ls `./my dir/*`
反引号字符串不能在字符串本身中包含不匹配的反引号。例如:
echo ````
``
echo ```
# 未终止的字符串将在CLI中开始新行
字符串作为外部命令
你可以在任何字符串(包括变量)前面加上^
符号,让Nushell执行该字符串,就像它是外部命令一样:
^'C:\Program Files\exiftool.exe'
let foo = 'C:\Program Files\exiftool.exe'
^$foo
你也可以使用run-external
命令来实现此目的,该命令提供了额外的标志和选项。
字符串拼接
有多种方法可以在字符串前后添加内容。如果你想在每个字符串的开头添加一些东西,闭包是一个不错的选择:
['foo', 'bar'] | each {|s| '~/' ++ $s} # ~/foo, ~/bar
['foo', 'bar'] | each {|s| '~/' + $s} # ~/foo, ~/bar
你也可以使用正则表达式替换字符串的开头或结尾:
['foo', 'bar'] | str replace -r '^' '~/'# ~/foo, ~/bar
['foo', 'bar'] | str replace -r '$' '~/'# foo~/, bar~/
如果你想在最后得到一个字符串,那么str join
是你的朋友:
"hello" | append "world!" | str join " " # hello world!
你也可以使用reduce:
1..10 | reduce -f "" {|elt, acc| $acc + ($elt | into string) + " + "} # 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 +
不过在字符串的情况下,特别是如果你不必对字符串进行操作,使用str join
通常更容易且更正确(注意上面例子中末尾多余的+)。
字符串插值
更复杂的字符串用例还需要一种新的字符串形式:字符串插值。这是一种从原始文本和执行表达式的结果中构建文本的方法。字符串插值将这些结果结合在一起,返回一个新的字符串。
字符串插值使用 $" "
和 $' '
作为包裹插值文本的方式。
例如,假设我们有一个叫做$name
的变量,我们想问候这个变量中所包含的人:
let name = "Alice"
$"greetings, ($name)"
# => greetings, Alice
通过使用()
包裹表达式,我们可以运行它们并使用结果来帮助生成字符串。
字符串插值有单引号:$' '
和双引号:$" "
这两种形式,分别对应于单引号和双引号字符串 —— 单引号字符串插值不支持转义字符,而双引号字符串插值支持。
从 0.61 版开始,字符串插值支持转义小括号,所以(
和)
字符可以在一个字符串中使用,而 Nushell 不会试图计算它们之间出现的内容:
$"2 + 2 is (2 + 2) \(you guessed it!)"
# => 2 + 2 is 4 (you guessed it!)
分割字符串
split row
命令从一个基于分隔符的字符串创建一个列表。 例如,let colors = ("red,green,blue" | split row ",")
创建列表[red green blue]
。
split column
命令将从一个基于分隔符的字符串中创建一个表。例如,let colors = ("red,green,blue" | split column ",")
创建一个表格,并为每个元素添加一列。
最后, split chars
命令将一个字符串分割成一个字符列表。
str
命令
许多字符串函数是str
命令的子命令,你可以使用help str
来获得一个完整的 str
命令列表。
例如, 你可以使用str contains
来检查一个字符串是否包含某个特定的字符:
"hello world" | str contains "w"
# => true
修剪字符串
你可以用 str trim
命令修剪字符串的两侧。默认情况下,str trim
命令会修剪字符串两边的空白。比如:
' My string ' | str trim
# => My string
你可以用 --right
和 --left
选项来指定对哪一边进行修剪。
要修剪一个特定的字符,使用 --char <Character>
来指定要修剪的字符。
下面是一个传入了所有选项的例子:
'=== Nu shell ===' | str trim -r -c '='
# => === Nu shell
子字符串
子字符串是一个字符串的切片,它们有起始点和结束点。下面是一个使用子串的例子:
'Hello World!' | str index-of 'o'
# => 4
'Hello World!' | str index-of 'r'
# => 8
'Hello World!' | str substring 4..8
# => o Wo
字符串填充
fill
:
'1234' | fill -a right -c '0' -w 10
# => 0000001234
'1234' | fill -a left -c '0' -w 10 | str length
# => 10
反转字符串
反转字符串可以通过 str reverse
命令轻松完成:
'Nushell' | str reverse
# => llehsuN
['Nushell' 'is' 'cool'] | str reverse
# => ╭───┬─────────╮
# => │ 0 │ llehsuN │
# => │ 1 │ si │
# => │ 2 │ looc │
# => ╰───┴─────────╯
解析字符串
通过 parse
命令,你可以将一个字符串解析成若干列。比如:
'Nushell is the best' | parse '{shell} is {type}'
# => ╭───┬─────────┬──────────╮
# => │ # │ shell │ type │
# => ├───┼─────────┼──────────┤
# => │ 0 │ Nushell │ the best │
# => ╰───┴─────────┴──────────╯
'Bash is kinda cringe' | parse --regex '(?P<shell>\w+) is (?P<type>[\w\s]+)'
# => ╭───┬───────┬──────────────╮
# => │ # │ shell │ type │
# => ├───┼───────┼──────────────┤
# => │ 0 │ Bash │ kinda cringe │
# => ╰───┴───────┴──────────────╯
字符串比较
除了标准的==
和!=
操作符外,还有一些专门用于比较字符串的操作符。
熟悉Bash和Perl的人会认识这些正则表达式比较操作符:
'APL' =~ '^\w{0,3}$'
# => true
'FORTRAN' !~ '^\w{0,3}$'
# => true
还有两个操作符用于更简单的比较:
'JavaScript' starts-with 'Java'
# => true
'OCaml' ends-with 'Caml'
# => true
字符串转换
有多种方法可以将字符串转换为其他类型或者反之。
转换为字符串
- 使用
into string
。例如:123 | into string
- 通过字符串插值。例如:
$'(123)'
字符串转换为其他类型
- 使用
into <type>
。例如:'123' | into int
字符串着色
你可以通过 ansi
命令给字符串着色。例如:
$'(ansi purple_bold)This text is a bold purple!(ansi reset)'
ansi purple_bold
使文本紫色加粗
ansi reset
将着色重置为默认值。(提示: 你应该总是用 ansi reset
来结束着色的字符串)