文件IO - O_DIRECT和O_SYNC详解_张慕枫的博客-CSDN博客_o

当前位置：首页 > 新闻动态 >

热卖商品

generalsynco/3-(4-methyl-2,5-dioxo-2,5-dihydrofuran-3-yl) propanoic acid/487-66-1

generalsynco/(Z)-3-cyanoacrylicacidethylester,ethyl-cis-(β-cyano)acrylate/40594-97-6

generalsynco/3-bromo-2-hydroxybenzoicacid/3883-95-2

generalsynco/1,3-Benzodioxole-4-carboxylicacid,5-chloro-/379229-83-1

新闻详情

文件IO - O_DIRECT和O_SYNC详解_张慕枫的博客-CSDN博客_o_sync

来自 : CSDN技术社区发布时间：2021-03-25

O_DIRECT和O_SYNC是系统调用open的flag参数。通过指定open的flag参数以特定的文件描述符打开某一文件。

这两个flag会对写盘的性能有很大的影响因此对这两个flag做一些详细的了解。

先看一个open函数的使用例子.

1 2 3 4 5 6 /* Open new or existing file for reading and wrting, sync io and no buffer io; file permissions read write for owner, nothing for all others */ fd open( myfile , O_RDWR | O_CREAT | O_SYNC | O_DIRECT, S_IRUSR | S_IWUSR); if (fd -1) errExit( open );   O_DIRECT: 无缓冲的输入、输出。 O_SYNC 以同步IO方式打开文件。下面对这两个flag做一些详细的说明。一 O_DIRECT 绕过缓冲区高速缓存直接IO 直接IO Linux允许应用程序在执行磁盘IO时绕过缓冲区高速缓存从用户空间直接将数据传递到文件或磁盘设备称为直接IO direct IO 或者裸IO raw IO 。应用场景数据库系统其高速缓存和IO优化机制均自成一体无需内核消耗CPU时间和内存去完成相同的任务。使用直接IO的弊端可能会大大降低性能内核对缓冲区告诉缓存做了不少优化包括按顺序预读取在成簇磁盘块上执行IO 允许访问同一文件的多个进程共享高速缓存的缓冲区。使用方法在调用open函数打开文件或设备时指定O_DIRECT标志。注意可能发生的不一致性若一进程以O_DIRECT标志打开某文件而另一进程以普通即使用了高速缓存缓冲区打开同一文件则由直接IO所读写的数据与缓冲区高速缓存中内容之间不存在一致性应尽量避免这一场景。使用直接IO需要遵守的一些限制用于传递数据的缓冲区其内存边界必须对齐为块大小的整数倍数据传输的开始点即文件和设备的偏移量必须是块大小的整数倍待传递数据的长度必须是块大小的整数倍。

不遵守上述任一限制均将导致EINVAL错误。

二 O_SYNC 以同步方式写入文件

功能强制刷新内核缓冲区到输出文件。这是有必要的因为为了数据安全需要确保将数据真正写入磁盘或者磁盘的硬件告诉缓存中。

我们先熟悉一下同步IO相关定义和系统调用。

同步IO数据完整性和同步IO文件完整性同步IO的定义某一IO操作要么已成功完成到磁盘的数据传递要么被诊断为不成功。 SUSv3定义的两种同步IO完成类型此处用英文因为译者也忍无可忍用了原文… synchronized IO data integrity completion 确保针对文件的一次更新传递了足够的信息部分文件元数据到磁盘以便于之后对数据的获取。synchronized IO file integrity completion 确保针对文件的一次更新传递了所有的信息所有文件元数据到磁盘即使有些在后续对文件数据的操作并不需要。用于控制文件IO内核缓冲的系统调用

1 fsync

作用 fsync()系统调用将使缓冲数据和fd相关的所有元数据都刷新到磁盘上。调用fsync会强制使文件处于Synchronized IO file integrity completion状态。函数声明 1 2 #include int fsync( int fd);  函数返回值 0: success-1: error 返回时间仅在对磁盘设备或者至少是其高速缓存的传递完成后 fsync()调用才会返回。 2 fdatasync 作用 fdatasync()系统调用的作用类似fsync() 只是强制文件处于synchronized IO data integrity compeletion状态。函数声明 1 2 #include int fdatasync( int fd);  函数返回值 0: success-1: error 与fsync的区别 fdatasync()可能会减少磁盘操作的次数由fsync()调用请求的两次变成一次。例如修改了文件的数据而文件大小不变那么调用fdatasync调用请求只强制进行了数据更新相比之下 fsync()调用会强制将元数据传递到磁盘上而元数据和文件数据通常驻留在磁盘的不同区域更新这些数据需要反复在整个磁盘上执行寻道操作。 3 sync系统调用作用 sync()系统调用会使包含更新文件信息的所有内核缓冲区即数据块、指针块、元数据等刷新到磁盘上。函数声明 1 2 #include void sync( void );  细节若内容发生变化的内核缓冲区在30s内未经显式方式同步到磁盘上则一条长期运行的内核线程会确保将其刷新到磁盘上。这一做法是为了规避缓冲区与相关磁盘文件内容长期处于不一致状态。 4 使所有写入同步 O_SYNC 调用open()函数时如制定O_SYNC标志则会使所有后续输出同步。 1 fd open(pathname, O_WRONLY | O_SYNC);  作用调用open后每个write调用会自动将文件数据和元数据刷新到磁盘上即按照Synchronized IO file integrity completion的要求执行写操作。 5 有无O_SYNC性能对比场景将一百万字节写入一个ext2文件系统上的新创建文件比较写入时间。对比结果 $\"NewImage\"$ 从结果中可以得到的结论采用O_SYNC标志或者频繁调用fsync(), fdatasync()或sync() 对性能影响极大。性能下降的直接表现为运行总用时大为增加在缓冲区为1字节的情况下运行时间相差1000多倍。以O_SYNC标志执行写操作时运行总用时和CPU时间之间的巨大差异 1030 - 98.8 原因是系统在每个缓冲区中将数据向磁盘传递时会把程序阻塞起来。三 IO缓冲层次关系先总结一下stdio函数库和内核采用的缓冲这两级缓冲然后用图说明两层缓冲机制和各种缓冲类型的控制机制。首先通过stdio库将用户数据传递到stdio缓冲区该缓冲区位于用户态内存区。当缓冲区填满 stdio库会调用write()系统调用将数据传递到内核高速缓冲区该缓冲区位于内核态内存区。最终内核发起磁盘操作。该层次结构如下图所示 $\"NewImage\"$

上图中左侧虚线方框中为可于任何时刻显式强制刷新各类缓冲区的调用。右侧所示为促使刷新自动化的调用通过禁用stdio的缓冲和在文件输出类的系统调用中启用同步从而使每个write()调用立刻刷新到磁盘。四小结输入输出数据的缓冲由内核和stdio库完成。有时可能希望阻止缓冲但这需要了解其对应用程序性能的影响。可以使用各种系统调用和库函数来控制内核和stdio缓冲并执行一次性的缓冲区刷新。在Linux环境下 open()所特有的O_DIRECT标识允许特定应用跳过缓冲区高速缓存。 $\"\"$ $\"\"$ $\"\"$ 点赞 4 $\"\"$ $\"\"$ 评论

本文链接： http://generalsynco.immuno-online.com/view-749375.html

发布于： 2021-03-25 阅读（0）

没有了