每天一个 Linux 知识：什么是管道？

摘要：命令1 | 命令2 | 命令3 ...工作原理：命令1执行后产生的“标准输出（stdout）”，会被管道直接传递给命令2作为“标准输入（stdin）”；若存在多个管道，数据会依次传递（命令2的输出作为命令3的输入），最终输出最终结果。核心优势：无需手动保存中间

管道（Pipe）是Linux系统中一种特殊的“通信机制”，其核心作用是连接两个或多个命令，让数据在命令间“流式传递”。

在命令行中，管道通过竖线符号 |（位于键盘Shift+\位置）表示，基本语法格式如下：

命令1 | 命令2 | 命令3 ...工作原理：命令1执行后产生的“标准输出（stdout）”，会被管道直接传递给命令2作为“标准输入（stdin）”；若存在多个管道，数据会依次传递（命令2的输出作为命令3的输入），最终输出最终结果。核心优势：无需手动保存中间结果（如将命令1的输出写入文件，再让命令2读取文件），实现“一步到位”的操作，减少磁盘I/O开销，提升执行速度。

例如，执行ps aux | grep firefox时，管道的作用流程为：

ps aux：输出系统中所有进程的详细信息（标准输出）；|：将ps aux的输出传递给后续命令；grep firefox：接收管道传递的进程信息，筛选出包含“firefox”关键词的进程行，最终输出结果。

要理解管道，需先明确Linux命令的“输入输出流”概念：

标准输入（stdin）：命令接收数据的来源（默认是键盘输入）；标准输出（stdout）：命令执行后产生的正常结果（默认输出到终端屏幕）；标准错误（stderr）：命令执行过程中产生的错误信息（默认也输出到终端屏幕）。

管道的核心能力是“重定向标准输出与标准输入”——它会“拦截”前一个命令的标准输出，将其重新定向为后一个命令的标准输入，但不会处理标准错误（若命令1执行出错，错误信息会直接输出到终端，不会传递给命令2）。

例如，若执行ls /nonexistent | grep txt（/nonexistent是不存在的目录）：

ls /nonexistent会产生错误信息（“ls: 无法访问'/nonexistent': 没有那个文件或目录”），该信息属于标准错误，不会被管道传递；grep txt因未收到任何输入（标准输入为空），最终无输出，仅终端会显示ls的错误信息。管道的常用场景

管道的灵活性体现在“可与大多数Linux命令配合”，以下是日常使用中最常见的场景，覆盖进程管理、文件筛选、日志分析等核心需求。

在系统管理中，常需查找特定进程（如“firefox”“Nginx”），但ps aux会输出大量进程信息，直接查看效率低。通过管道结合grep，可快速筛选目标进程：

# 查找包含"firefox"关键词的进程ps aux | grep firefox# 查找nginx进程（排除grep自身进程，避免干扰）ps aux | grep nginx | grep -v grepgrep -v grep：-v选项表示“反向筛选”，排除包含“grep”的行（因grep nginx本身也是一个进程，会出现在ps aux的输出中）。

ls命令可列出目录下的文件，但需筛选特定类型（如.log日志文件）或特定大小的文件时，可结合grep或awk等命令：

# 列出当前目录下所有.log后缀的文件ls -l | grep "\.log$"# 列出当前目录下大小超过100MB的文件（ls -l中第5列为文件大小，单位为字节）ls -l | awk '$5 > 1024*1024*100 {print $9, $5/1024/1024 "MB"}'grep "\.log$"：\.转义“.”（避免被当作正则通配符），$表示“行尾”，即筛选以“.log”结尾的行；awk '$5 > 1024*1024*100 {print ...}'：awk是文本处理工具，$5表示取第5列（文件大小），判断是否超过100MB（10241024100字节），并输出文件名（$9）和换算后的大小。

当需要对命令输出的结果进行统计（如行数、总数）或排序时，管道结合wc（统计）、sort（排序）命令可高效实现：

# 统计当前目录下.log文件的总数（先筛选.log文件，再统计行数）ls -l | grep "\.log$" | wc -l# 查看系统中内存占用前5的进程（按内存使用率排序，取前5行）ps aux --sort=-%mem | head -n 6wc -l：wc是统计命令，-l选项表示“统计行数”，每行对应一个.log文件，因此行数即文件总数；ps aux --sort=-%mem：--sort=-%mem表示按“%mem”（内存使用率）降序排序（-表示降序）；head -n 6：head用于查看文件前N行，-n 6表示取前6行（第1行为ps aux的表头，后5行为内存占用前5的进程）。

日志文件（如/var/log/syslog、Nginx访问日志）通常包含大量数据，需提取关键信息（如错误日志、特定IP的访问记录）。通过管道串联grep、awk等命令，可快速定位所需内容：

# 从/var/log/nginx/error.log中提取近24小时的错误日志（假设日志含时间戳）grep "$(date -d '24 hours ago' +'%Y/%m/%d')" /var/log/nginx/error.log | grep "ERROR"# 从Nginx访问日志中统计访问次数最多的前3个IP（日志第1列为IP）awk '{print $1}' /var/log/nginx/access.log | sort | uniq -c | sort -nr | head -n 3date -d '24 hours ago' +'%Y/%m/%d'：生成24小时前的日期（如“2025/10/25”），作为grep的筛选条件；uniq -c：uniq用于去重，-c选项表示“统计重复行的次数”（即每个IP的访问次数）；sort -nr：-n表示“按数字排序”，-r表示“降序”，即按访问次数从高到低排序。

来源：wljslmz一点号

标签： linux grep awk nginx aux

本文地址：http://news.43b.com.cn/a/1720851.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!