技术标签: bc # Shell awk shell xargs
该系列是基于牛客Shell题库,针对具体题目进行查漏补缺,学习相应的命令。
刷题链接:牛客题霸-Shell篇。
该系列文章都放到专栏下,专栏链接为:《专栏:Linux》。欢迎关注专栏~
本文知识预告:
awk
命令和xargs
命令以及shell中小数运算的语法,给出了四种方法,算是对已学命令的回顾吧。写一个bash脚本以实现一个需求,求输入的一个数组的平均值
示例:数组长度为4,数组元素为1 2 9 8
4
1
2
9
8
那么平均值为:5.000(保留小数点后面3位)你的脚本获取以上输入应当输出:
5.000
xargs
:给其他命令传参数的过滤器xargs
命令来自于英文词组” extended arguments“的缩写,其功能是用于给其他命令传参数的过滤器。xargs
命令能够处理从标准输入或管道符输入的数据,并将其转换成命令参数,也可以将单行或多行输入的文本转换成其他格式。
xargs
命令默认接收的信息中,空格是默认定界符,所以可以接收包含换行和空白的内容。
语法格式: xargs [参数]
常用参数:
-n |
多行输出 |
---|---|
-d |
自定义一个定界符 |
-I |
指定一个替换字符串{} |
-t |
打印出xargs 执行的命令 |
-p |
执行每一个命令时弹出确认 |
参考实例
lucky@DESKTOP-VQ8KID4:~$ cat nowcoder.txt | xargs -n 1
how
they
are
implemented
and
applied
in
computer
X
为定界符,默认以单行的形式输出字符串内容:lucky@DESKTOP-VQ8KID4:~$ echo "FirstXSecondXThirdXFourthXFifth" | xargs -dX
First Second Third Fourth Fifth
X
为定界符,以多行形式输出文本内容,每行显示两段内容值:lucky@DESKTOP-VQ8KID4:~$ echo "FirstXSecondXThirdXFourthXFifth" | xargs -dX -n 2
First Second
Third Fourth
Fifth
lucky@DESKTOP-VQ8KID4:~$ echo "FirstXSecondXThirdXFourthXFifth" | xargs -dX -n 2 -p
echo First Second ?...y
First Second
echo Third Fourth ?...y
Third Fourth
echo 'Fifth'$'\n' ?...n
awk
:文本和数据进行处理的编程语言awk
命令来自于三位创始人”Alfred Aho,Peter Weinberger, Brian Kernighan “的姓氏缩写,其功能是用于对文本和数据进行处理的编程语言。使用awk
命令可以让用户自定义函数或正则表达式对文本内容进行高效管理,与sed
、grep
并称为Linux系统中的文本三剑客。
语法格式:awk 参数 文件
常用参数:
参数 | 功能 |
---|---|
-F |
指定输入时用到的字段分隔符 |
-v |
自定义变量 |
-f |
从脚本中读取awk 命令 |
-m |
对val 值设置内在限制 |
常用的awk
内置变量:
awk
语法由一系列条件和动作组成,在花括号内可以有多个动作,多个动作之间用分号分隔,在多个条件和动作之间可以有若干空格,也可以没有。
变量名称 | 说明 |
---|---|
FILENAME |
当前输入文档的文件名 |
FNR |
当前输入文档的当前行号,尤其当多个输入文档时有用 |
FS |
设置字段分隔符,默认为空格或制表符 |
NF |
当前记录(行)的字段(列)个数 |
NR |
输入数据流的当前记录数(行号) |
OFS |
输出字段分隔符,默认为空格 |
ORS |
输出记录分隔符,默认为换行符 |
RS |
输入记录分隔符,默认为换行符 |
awk
是一种处理文本文件的编程语言,文件的每行数据都被称为记录,默认以空格或制表符为分隔符,每条记录被分成若干字段(列),awk
每次从文件中读取一条记录。
例子:
lucky@DESKTOP-VQ8KID4:~/shell$ awk '{print $1,$2}' nowcoder.txt
#include <iostream>
using namespace
int main()
{
int a
int b
cout <<
return 0;
}
lucky@DESKTOP-VQ8KID4:~/shell$ awk -F : '{print $1,$2}' /etc/passwd
root x
daemon x
bin x
...
tcpdump x
sshd x
landscape x
pollinate x
lucky x
/etc/passwd
文件中的内容由:
分隔开。
lucky@DESKTOP-VQ8KID4:~/shell$ awk -F : '$3>=500' /etc/passwd
nobody:x:65534:65534:nobody:/nonexistent:/usr/sbin/nologin
lucky:x:1000:1000:,,,:/home/lucky:/bin/bash
main
的内容:lucky@DESKTOP-VQ8KID4:~/shell$ awk '/main/{print}' nowcoder.txt
int main()
lucky@DESKTOP-VQ8KID4:~/shell$ awk -F : '{print $NF}' /etc/passwd
/bin/bash
/usr/sbin/nologin
/usr/sbin/nologin
...
/usr/sbin/nologin
/bin/false
/bin/bash
NR
将所有文件的数据视为一个数据流,而FNR
则是将多个文件的数据视为独立的若干个数据流,遇到新文件时行号从1开始重新递增。lucky@DESKTOP-VQ8KID4:~$ awk '{print NR}' first.txt three.sh
1
2
3
lucky@DESKTOP-VQ8KID4:~$ awk '{print FNR}' first.txt three.sh
1
1
2
前面讲的一些命令,都只能用于整型,计算结果只有整数,小数点后直接丢弃,比如:
expr 1 + 2
数字和符号之间必须有空格!$[1/2]
计算结果只有整数,小数点后直接丢弃$(())
计算结果只有整数,小数点后直接丢弃, 幂运算 $((2**3))
前式即2的3次幂let y=2+3
/ let x=y+2
/ let x=${y}+2
计算结果只有整数,小数点后直接丢弃下面来详细讲解shell中的小数运算:
bc
做小数运算lucky@DESKTOP-VQ8KID4:~$ echo "5.999 + 25.001"|bc
31.000
lucky@DESKTOP-VQ8KID4:~$ echo "5.111 + 5.111235"|bc
10.222235
lucky@DESKTOP-VQ8KID4:~$ echo "5.111 - 5.111235"|bc
-.000235
lucky@DESKTOP-VQ8KID4:~$ echo "25.111 - 5.111235"|bc
19.999765
lucky@DESKTOP-VQ8KID4:~$ echo "3.14 * 2.5" | bc
7.85
如果不指定scale
参数,乘积小数点位数默认以乘数中小数点位数最多的为准。如果使用scale
指定乘积的小数点位数时:(若实际的乘积小数点位数为 m
,乘数中小数点位数最多为 n
)
scale<n
时,scale
不起作用,乘积的小数点位数为n
;scale>=m
,乘积的小数点位数为m
,末尾不会补零;n<scale<m
时,乘积的小数点位数为scale
值。lucky@DESKTOP-VQ8KID4:~$ echo "scale=5;5 / 2"|bc
2.50000
除法中如果不指定scale
参数,则结果没有小数位,小数位数完全按scale
值来显示,计算结果的小数位数不足scale
的值,则末尾补0。
lucky@DESKTOP-VQ8KID4:~$ a=3.2
lucky@DESKTOP-VQ8KID4:~$ b=1.5
lucky@DESKTOP-VQ8KID4:~$ c=`echo "scale=3;$a + $b"|bc`
lucky@DESKTOP-VQ8KID4:~$ echo $c
4.7
awk
做小数运算awk
使用print
函数进行运算lucky@DESKTOP-VQ8KID4:~$ awk 'BEGIN{print '"$a"' / '"$b"'}'
1.66667
lucky@DESKTOP-VQ8KID4:~$ awk 'BEGIN{
print "'$a'" / '"$b"'}'
1.66667
建议在
awk
中引用shell变量,使用格式:"'$var'"
或者'"$var"'
awk
使用printf
函数控制运算结果的小数点位数lucky@DESKTOP-VQ8KID4:~$ echo "$a $b" | awk '{printf("%.3f\n", $1/$2)}'
1.667
lucky@DESKTOP-VQ8KID4:~$ a=5;b=3
lucky@DESKTOP-VQ8KID4:~$ awk 'BEGIN{printf("%.2f\n",'$a' / '$b')}'
1.67
lucky@DESKTOP-VQ8KID4:~$ c=`awk -v x=2.45 -v y=3.123 'BEGIN{printf "%.2f\n",x*y}'`
lucky@DESKTOP-VQ8KID4:~$ echo $c
7.65
这道题目主要涉及的是小数的运算,和【Shell牛客刷题系列】SHELL8 统计所有进程占用内存百分比的和:一起学习Shell脚本中的小数运算~是差不多的。
awk
awk '{if(NR==1){N=$1}else{sum+=$1}}END{printf("%.3f", sum / N)}' nowcoder.txt
awk
定义变量awk -v i=0 -v j=0 '{
if(NR>1){
i+=$1;
j++
}
}END{
printf("%.3f\n", i/j)
}' nowcoder.txt
xargs
拉平数据配合awk
命令cat nowcoder.txt | xargs | awk '{for(i=2;i<=NF;i++){sum+=$i}}END{printf("%.3f", sum/$1)}'
sum=0
line=1
while read strs; do
if [ $line -eq 1 ]; then
N=$strs
else
let sum+=$strs
fi
let line++
done <nowcoder.txt
echo "scale=3; $sum / $N" | bc
注意几个点:
-eq
!!!(真无语,每次都要忘…)scale=3
文章浏览阅读1w次,点赞29次,收藏213次。前言本篇文本分类实战训练是以完整的文本分类项目流程来写的,比较适合进阶和提高《获取数据》——《数据分析和处理》——《特征工程与选择》——《算法模型》——《性能评估/参数调优》这一篇训练比较重视批量读取和处理文本数据集;其中也比较重视函数的使用以提高代码的复用率。在分类算法这一块,本篇项目总共使用了 《14》 种分类算法来进行文本分类,涵盖《sklearn》中的常规分类算法和集成学习算法;竞赛和工业界比较得宠的集成学习算法《xgboost》和《lightgbm》;深度学习框架《Ker_文本分类算法
文章浏览阅读478次。#include #include #include #include #define BLOCK_SIZE 16static void HandleError(cudaError_t err, const char *file, int line){ if (err != cudaSuccess) { printf("%s in %s at line %d\n", cuda_static void handleerror(cudaerror_t err, const char *file, int line) {
文章浏览阅读3.9w次,点赞69次,收藏69次。最新版本的KEIL5,并不是像原来的KEIL4一样,将89C51系列芯片放在Atmel里面,而是放在Microchip里面:_keil的89c51在哪
文章浏览阅读1.5k次。一、【GB/T 12604.4-2005】无损检测术语--声发射检测本标准主要定义了声发射检测的专用术语,包括概念性名词解释、特征参数解释、设置参数解释等。 术语中文翻译名字的可能有不同的叫法,所以使用英文名字为唯一识别。 参数图解基本以下图为例,如果不知道以下图形的来历,可以回复“声发射信号的三种表现形式”获取文字链接。本标准定义的术语一览(部分,后部分见二): 序号 ..._声发射上升时间是什么
文章浏览阅读3.9k次,点赞11次,收藏44次。由于CSDN上下载东西需要开会员或者积分,所以我把代码在GitHub上开源了,这也是我作为小白开源的第一个项目。在此只展示代码的效果图,各位如有兴趣还请移步至GItHub了解详细情况。传送门:https://github.com/poxiao2/CCTDecode这份代码主要有三个功能:1.绘制CCT图片。编码位数和图片尺寸都是可选的。如图所示:2.CCT探测和解..._cct环形编码
文章浏览阅读2.4k次。题目链接:http://poj.org/problem?id=2421Time Limit:2000MSMemory Limit:65536KDescriptionThere are N villages, which are numbered from 1 to N, and you should build some roads such that every two villa..._constructing roads poj
文章浏览阅读4.9k次,点赞4次,收藏5次。最近在做Mina的开发,之中存在数据_warning: jks 密钥库使用专用格式。建议使用 "keytool -importkeystore -srckeyst
文章浏览阅读7.6k次,点赞6次,收藏14次。pagehelper-sprng-boot-starter和mybatis-plus-spring-boot-starter同时引入启动时会报错,即使按网上的排出pagehelper-starter的mybatis包依旧报错,具体解决办法如下:<dependency> <groupId>com.github.pagehelper</groupId..._pagehelper-spring-boot-starter mybatis plus
文章浏览阅读446次。String json=JSON.toJSONString(user);//关键1.简单的解析json字符串首先将json字符串转换为json对象,然后再解析json对象,过程如下。 1 JSONObject jsonObject = JSONObject.fromObject(jsonStr); 根据json中的键得到它的值 1 2 3 4 String name = jsonObject.get._接收{}对象,此处接收数组对象会有异常
文章浏览阅读5.3k次,点赞12次,收藏87次。Tesseract最初由惠普实验室支持,用于电子版文字识别,1996年被移植到Windows上,1998年进行了C++化,在2005年Tesseract由惠普公司宣布开源。2006年到现在,由Google公司维护开发。最初Tesseract是用C语言写的,在1998年改用C++。..._机器学习如何图片中文字识别的程序
文章浏览阅读2k次,点赞4次,收藏24次。输入捕获模式可以用来测量脉冲宽度或者测量频率原理图如图 所示,就是输入捕获测量高电平脉宽的原理,假定定时器工作在向上计数模式,图中 t1~t2 时间,就是我们需要测量的高电平时间。测量方法如下:首先设置定时器通道 x 为上升沿捕获,这样, t1 时刻,就会捕获到当前的 CNT 值,然后立即清零 CNT,并设置通道 x为下降沿捕获,这样到 t2 时刻,又会发生捕获事件,得到此时的 CNT 值,记为 CCRx2。这样,根据定时器的计数频率,我们就可以算出 t1~t2 的时间,从而得到高电平脉宽。_stm32使用定时器对脉冲进行捕获和计数
文章浏览阅读5.7k次,点赞6次,收藏46次。struct BTNode{ int data; struct BTNode *lchild; struct BTNode *rchild;}BTNode * MinNode(BTNode *b){ if (b != NULL){ BTNode *min1, *min2, *min; if (b->lchild == NULL &..._c语言非空二叉树最小值结点