【转载】SHELL字符串处理技巧（${}、##、%%）

转载自：http://www.cnblogs.com/pmars/archive/2013/02/17/2914444.html

在SHELL编程中，经常要处理一些字符串变量。比如，计算长度啊、截取子串啊、字符替换啊等等，常常要用到awk、expr、sed、tr等命令。下面给大家介绍个简单的字符串处理方法，用不着嵌套复杂的子命令。

${#VALUE}：计算VALUE字符串的字符数量。
${VALUE%.*}或${VALUE%%.*}：删除VALUE字符串中以分隔符“.”匹配的右边字符，保留左边字符。
${VALUE#*.}或${VALUE##*.}：删除VALUE字符串中以分隔符“.”匹配的左边字符，保留右边字符。
${VALUE/OLD/NEW}或${VALUE//OLD/NEW}：用NEW子串替换VALUE字符串中匹配的OLD子串。

补充：“*”表示通配符，用于匹配字符串将被删除的字串。“.”表示字符串中分隔符，可以为任意一个或多个字符。“%”表示从右向左匹配，“#”表示从左向右匹配，“”表示替换，都属于非贪婪匹配，即匹配符合通配符的最短结果。与“%”、“#”和“/” 类似的有“%%”、“##”和“//”，都属于贪婪匹配，即匹配符合通配符的最长结果。

${VALUE:OFFSET}或${VALUE:OFFSET:LENGTH}：从VALUE字符串的左边开始中截取子串。
${VALUE:0-OFFSET}或${VALUE:0-OFFSET:LENGTH}：从VALUE字符串的右边开始中截取子串。

补充：左边第一个字符从“0”开始，右边第一个字符从“0-1”开始。表示偏移OFFSET个字符开始，LENGTH表示要截取字符的长度。如果没有LENGTH变量，表示偏移OFFSET个字符开始到字符串结束。

${VALUE:-WORD}：当变量未定义或者值为空时，返回值为WORD的内容，否则返回变量的值。
${VALUE:=WORD}：当变量未定义或者值为空时，返回WORD的值的同时并将WORD赋值给VALUE，否则返回变量的值。
${VALUE:+WORD}：当变量已赋值时，其值才用WORD替换，否则不进行任何替换。
${VALUE:?MESSAGE}：当变量已赋值时，正常替换。否则将消息MESSAGE送到标准错误输出（若此替换出现在SHELL程序中，那么该程序将终止运行）。

补充：WORD可以为一个字符串，也可以为一个变量。当为变量时，需要用“$”引用该变量。

参考：http://blog.zol.com.cn/2322/article_2321763.html

$( ) 与 ` ` (反引号)
在 bash shell 中，$( ) 与 ` ` (反引号) 都是用来做命令替换用(command substitution)的。

所谓的命令替换与我们第五章学过的变量替换差不多，都是用来重组命令行：
* 完成引号里的命令行，然后将其结果替换出来，再重组命令行。
例如：

$ echo the last sunday is $(date -d "last sunday" +%Y-%m-%d)

如此便可方便得到上一星期天的日期了… ^_^

用 $( ) 的理由：

1, ` ` 很容易与 ‘ ‘ ( 单引号)搞混乱，尤其对初学者来说。
有时在一些奇怪的字形显示中，两种符号是一模一样的(直竖两点)。
当然了，有经验的朋友还是一眼就能分辩两者。只是，若能更好的避免混乱，又何乐不为呢？ ^_^

2, 在多层次的复合替换中，` ` 须要额外的跳脱( \` )处理，而 $( ) 则比较直观。例如：
这是错的：

command1 `command2 `command3` `

原本的意图是要在 command2 `command3` 先将 command3 提换出来给 command 2 处理，
然后再将结果传给 command1 `command2 …` 来处理。
然而，真正的结果在命令行中却是分成了 `command2 ` 与 “ 两段。
正确的输入应该如下：

command1 `command2 \`command3\` `

要不然，换成 $( ) 就没问题了：

command1 $(command2 $(command3))

只要你喜欢，做多少层的替换都没问题啦~~~ ^_^

$( ) 的不足:
1. ` ` 基本上可用在全部的 unix shell 中使用，若写成 shell cript：，其移植性比较高。
而 $( ) 并不见的每一种 shell 都能使用，我只能跟你说，若你用 bash2 的话，肯定没问题… ^_^

${ } 用来作变量替换。
一般情况下，$var 与 ${var} 并没有啥不一样。
但是用 ${ } 会比较精确的界定变量名称的范围，比方说：
$ A=B
$ echo $AB
原本是打算先将 $A 的结果替换出来，然后再补一个 B 字母于其后，
但在命令行上，真正的结果却是只会提换变量名称为 AB 的值出来…
若使用 ${ } 就没问题了：
$ echo ${A}B
BB

不过，假如你只看到 ${ } 只能用来界定变量名称的话，那你就实在太小看 bash 了﹗
有兴趣的话，你可先参考一下 cu 本版的精华文章：
http://www.chinaunix.net/forum/viewtopic.php?t=201843

为了完整起见，我这里再用一些例子加以说明 ${ } 的一些特异功能：
假设我们定义了一个变量为：
file=/dir1/dir2/dir3/my.file.txt
我们可以用 ${ } 分别替换获得不同的值：
${file#*/}：拿掉第一条 / 及其左边的字符串：dir1/dir2/dir3/my.file.txt
${file##*/}：拿掉最后一条 / 及其左边的字符串：my.file.txt
${file#*.}：拿掉第一个 . 及其左边的字符串：file.txt
${file##*.}：拿掉最后一个 . 及其左边的字符串：txt
${file%/*}：拿掉最后条 / 及其右边的字符串：/dir1/dir2/dir3
${file%%/*}：拿掉第一条 / 及其右边的字符串：(空值)
${file%.*}：拿掉最后一个 . 及其右边的字符串：/dir1/dir2/dir3/my.file
${file%%.*}：拿掉第一个 . 及其右边的字符串：/dir1/dir2/dir3/my
记忆的方法为：

# 是去掉左边(在鉴盘上 # 在 $ 之左边)
% 是去掉右边(在鉴盘上 % 在 $ 之右边)
单一符号是最小匹配﹔两个符号是最大匹配。

${file:0:5}：提取最左边的 5 个字节：/dir1
${file:5:5}：提取第 5 个字节右边的连续 5 个字节：/dir2

我们也可以对变量值里的字符串作替换：
${file/dir/path}：将第一个 dir 提换为 path：/path1/dir2/dir3/my.file.txt
${file//dir/path}：将全部 dir 提换为 path：/path1/path2/path3/my.file.txt

利用 ${ } 还可针对不同的变量状态赋值(没设定、空值、非空值)：
${file-my.file.txt} ：假如 $file 没有设定，则使用 my.file.txt 作传回值。(空值及非空值时不作处理)
${file:-my.file.txt} ：假如 $file 没有设定或为空值，则使用 my.file.txt 作传回值。 (非空值时不作处理)
${file+my.file.txt} ：假如 $file 设为空值或非空值，均使用 my.file.txt 作传回值。(没设定时不作处理)
${file:+my.file.txt} ：若 $file 为非空值，则使用 my.file.txt 作传回值。 (没设定及空值时不作处理)
${file=my.file.txt} ：若 $file 没设定，则使用 my.file.txt 作传回值，同时将 $file 赋值为 my.file.txt 。 (空值及非空值时不作处理)
${file:=my.file.txt} ：若 $file 没设定或为空值，则使用 my.file.txt 作传回值，同时将 $file 赋值为 my.file.txt 。 (非空值时不作处理)
${file?my.file.txt} ：若 $file 没设定，则将 my.file.txt 输出至 STDERR。 (空值及非空值时不作处理)
${file:?my.file.txt} ：若 $file 没设定或为空值，则将 my.file.txt 输出至 STDERR。 (非空值时不作处理)

tips:
以上的理解在于, 你一定要分清楚 unset 与 null 及 non-null 这三种赋值状态.
一般而言, : 与 null 有关, 若不带 : 的话, null 不受影响, 若带 : 则连 null 也受影响.

还有哦，${#var} 可计算出变量值的长度：
${#file} 可得到 27 ，因为 /dir1/dir2/dir3/my.file.txt 刚好是 27 个字节…

接下来，再为大家介稍一下 bash 的组数(array)处理方法。
一般而言，A=”a b c def” 这样的变量只是将 $A 替换为一个单一的字符串，
但是改为 A=(a b c def) ，则是将 $A 定义为组数…
bash 的组数替换方法可参考如下方法：
${A[@]} 或 ${A[*]} 可得到 a b c def (全部组数)
${A[0]} 可得到 a (第一个组数)，${A[1]} 则为第二个组数…
${#A[@]} 或 ${#A[*]} 可得到 4 (全部组数数量)
${#A[0]} 可得到 1 (即第一个组数(a)的长度)，${#A[3]} 可得到 3 (第四个组数(def)的长度)
A[3]=xyz 则是将第四个组数重新定义为 xyz …

好了，最后为大家介绍 $(( )) 的用途吧：它是用来作整数运算的。
在 bash 中，$(( )) 的整数运算符号大致有这些：
+ – * / ：分别为 “加、减、乘、除”。
% ：余数运算
& | ^ !：分别为 “AND、OR、XOR、NOT” 运算。

例：
$ a=5; b=7; c=2
$ echo $(( a+b*c ))
19
$ echo $(( (a+b)/c ))
6
$ echo $(( (a*b)%c))
1

在 $(( )) 中的变量名称，可于其前面加 $ 符号来替换，也可以不用，如：
$(( $a + $b * $c)) 也可得到 19 的结果

此外，$(( )) 还可作不同进位(如二进制、八进位、十六进制)作运算呢，只是，输出结果皆为十进制而已：
echo $((16#2a)) 结果为 42 (16进位转十进制)
以一个实用的例子来看看吧：
假如当前的 umask 是 022 ，那么新建文件的权限即为：
$ umask 022
$ echo “obase=8;$(( 8#666 & (8#777 ^ 8#$(umask)) ))” | bc
644

事实上，单纯用 (( )) 也可重定义变量值，或作 testing：
a=5; ((a++)) 可将 $a 重定义为 6
a=5; ((a–)) 则为 a=4
a=5; b=7; ((a < b)) 会得到 0 (true) 的返回值。
常见的用于 (( )) 的测试符号有如下这些：
<：小于
>：大于
<=：小于或等于
>=：大于或等于
==：等于
!=：不等于

【转载】SHELL字符串处理技巧（${}、##、%%）

Published by

风君子

发表回复取消回复

Published by

风君子

发表回复 取消回复

发表回复取消回复