使用流的核心工具 – 通用操作系统服务(Python教程)(参考资料)
概述
io
模块提供了Python处理各种I / O的主要工具。有三种主要类型的I / O:文本I / O 二进制I / O 和原始I / O 。这些是通用类别,可以为每个类别使用各种后备存储。属于任何这些类别的具体对象称为文件对象。其他常用术语是流和文件对象
独立于其类别,每个具体流对象还将具有各种功能:它可以是只读,只写或读写。它允许任意随机访问(向前或向后寻找任何位置),或仅允许顺序访问(例如在套接字或管道的情况下)。
所有流都要注意您提供给它们的数据类型。例如str
对象write()
二进制流的方法会引发TypeError
。所以将bytes
对象赋予文本流的write()
方法。
IOError
现在加注OSError
,自IOError
现在是的别名OSError
文字I / O
文本I / O期望并生成str
对象。这意味着,当后备存储本身由字节组成时(例如在文件的情况下),数据的编码和解码是透明的,也可以是特定于平台的换行符的可选翻译。
创建文本流的最简单方法是使用open()
,可选择指定编码:
f = open("myfile.txt", "r", encoding="utf-8")
内存中的文本流也可用作StringIO
对象:
f = io.StringIO("some initial text data")
文本流API在TextIOBase
二进制I / O
二进制I / O(也叫缓冲I / O )期望字节对象并生成bytes
对象。不执行编码,解码或换行。流的这种类别可以用于所有类型的非文本数据,并且还可以用于对文本数据的处理的手动控制。
创建二进制流的最简单方法是使用open()
和"b"
模式字符串:
f = open("myfile.jpg", "rb")
内存中的二进制流也可用作BytesIO
对象:
f = io.BytesIO(b"some initial binary data: \x00\x01")
二进制流API在BufferedIOBase
的文档中有详细描述。
其他库模块可以提供创建文本或二进制流的其他方式。例如,见socket.socket.makefile()
。
原始I / O
原始I / O(也称为无缓冲I / O )通常用作二进制和文本流的低级构建块;从用户代码直接操作原始流很少有用。不过,您可以通过在禁用缓冲的情况下以二进制模式打开文件来创建原始流:
f = open("myfile.jpg", "rb", buffering=0)
原始流API在RawIOBase
高级模块接口的文档中详细描述
io.
DEFAULT_BUFFER_SIZE
- 一个int,包含模块缓冲的I / Oclasses使用的默认缓冲区大小。
open()
如果可能的话,使用文件的blksize(由os.stat()
获得)
io.
open
(文件mode=\”r\”缓冲= -1 编码=无错误=无换行符=无 closefd =真 opener =无)- 这是内置的一个别名
open()
function.
- exception
io.
BlockingIOError
- 这是一个兼容性别名for builtin
BlockingIOError
exception.
- exception
io.
UnsupportedOperation
- 继承
OSError
和ValueError
的异常,当一个不受支持的操作被调用时会被引发stream.
Inmemeory streams
也可以使用str
或字节对象作为读取和写入的文件。对于字符串StringIO
可以像在文本模式下打开的文件一样使用。BytesIO
可以像二进制模式下打开的文件一样使用。两者都提供randomaccess的完全读写功能。
另见
sys
- 包含标准IO流:
sys.stdin
sys.stdout
和sys.stderr
类层次
I / O流的实现被组织为类的层次结构。首先抽象基类(ABCs),用于指定各种类型的流,然后是提供标准流实现的具体类。
注意
抽象基类还提供了一些方法的默认实现,以帮助实现具体的流类。例如,
BufferedIOBase
提供了readinto()
和readline()
的未经优化的实现
在I / O层次结构的顶部是抽象基类IOBase
。它定义了流的基本接口。但请注意,读取和写入流之间存在分离;如果它们不支持给定的操作,则允许实现UnsupportedOperation
。
RawIOBase
ABC扩展IOBase
。它处理读取和写入流的字节。FileIO
子类RawIOBase
为机器文件系统中的文件提供接口。
BufferedIOBase
ABC处理原始字节流(RawIOBase
)上的缓冲。它的子类BufferedWriter
BufferedReader
和BufferedRWPair
缓冲流是可读的,可写的,并且是可读写的。BufferedRandom
为随机访问流提供缓冲接口。另一个BufferedIOBase
子类BytesIO
是一个内存中的流。
TextIOBase
ABC是IOBase
的另一个子类,它处理其字节代表文本的流,并处理字符串的编码和解码。TextIOWrapper
,扩展它,是缓冲原始流(BufferedIOBase
)的缓冲文本接口。最后,StringIO
是文本的内存流。
参数名称不是规范的一部分,只有open()
的参数用作关键字参数。
下表总结了io
模块提供的ABC:
ABC | 继承 | 存根方法 | Mixin方法和属性 |
---|---|---|---|
IOBase |
fileno seek ,和truncate |
close closed __enter__ __exit__ flush isatty __iter__ __next__ readable readline readlines seekable tell writable ,和writelines |
|
RawIOBase |
IOBase |
readinto 和write |
继承IOBase 方法,read 和readall |
BufferedIOBase |
IOBase |
detach read read1 ,和write |
继承IOBase 方法,readinto ,和readinto1 |
TextIOBase |
IOBase |
detach read readline ,和write |
继承IOBase 方法,encoding errors 和newlines |
I / O基类
- class
io.
IOBase
- 所有I / O类的抽象基类,作用于字节流。没有公共构造函数。
此类为许多方法提供空抽象实现,派生类可以有选择地覆盖;defaultimplementations表示无法读取,写入orseeked的文件。
即使
IOBase
没有声明read()
readinto()
或write()
,因为它们的签名会有所不同,实现和客户端应该将这些方法视为接口的一部分。此外,当调用它们不支持的操作时,实现可能会引发ValueError
(或UnsupportedOperation
)。用于从文件读取或写入文件的二进制数据的基本类型是
bytes
。其他类似字节的对象也被接受为方法参数。在某些情况下,例如readinto()
,需要一个可写对象,例如bytearray
。文本I / O类适用于str
数据。请注意,在已关闭的流上调用任何方法(甚至是查询)都是未定义的。在这种情况下,实现可能会引发
ValueError
。IOBase
(及其子类)支持迭代器协议,这意味着IOBase
可以迭代对象,从而产生流中的线。根据流是二进制流(产生字节)还是文本流(产生字符串),行的定义略有不同。见readline()
下面。IOBase
也是一个上下文管理器,因此支持with
语句。在这个例子中,文件在with
语句的套件已完成 – 即使发生异常:with open("spam.txt", "w") as file: file.write("Spam and eggs!")
IOBase
提供这些数据属性和方法:close
()- 冲洗并关闭此流。如果文件已经关闭,则此方法无效。文件关闭后,对文件的任何操作(例如读取或写入)都会引发
ValueError
。为方便起见,允许多次调用此方法;但是,只有第一次调用会产生效果.
closed
True
如果流关闭了
fileno
//()- 如果是itexists,则返回流的基础文件描述符(整数)。如果IO对象不使用filedescriptor
OSError
(
flush
)如果适用,则刷新流的写缓冲区,引发- 。这对于只读和非阻塞流没有任何作用.
isatty
()- 如果流是交互式的(或连接到终端),则返回
True
/ tty device).
readable
()- 返回
True
如果可以读取流。如果False
read()
将提升OSError
readline
( size = -1 )- 从流中读取并返回一行。如果指定大小,则将读取大小字节。
对于二进制文件,行终止符总是
b"\n"
;对于文本文件,换行对open()
的参数可用于选择识别的行终止符.
readlines
(提示= -1 )- 从流中读取并返回行列表。暗示可以指定控制读取的行数:如果到目前为止所有行的总大小(以字节/字符为单位)超过提示。
请注意,已经可以使用
forline in file: ...
迭代文件对象而无需调用file.readlines()
seek
(偏移 [ whence ] )- 将流位置改为给定的字节offset offset 相对于 whence 指示的位置进行解释。的默认值是
SEEK_SET
。从的值是:SEEK_SET
要么0
– 开始流(默认); 偏移应为零或正SEEK_CUR
或1
– 当前流位置;偏移可能是否定的SEEK_END
或2
– 流的结尾;偏移通常是负的
返回新的绝对位置。
版本3.1中新增:
SEEK_*
常量。版本3.3中的新内容:某些操作系统可以支持其他值,例如
os.SEEK_HOLE
或os.SEEK_DATA
。文件的有效值可能取决于它是以文本还是二进制模式打开。
seekable
()- 返回
True
如果流支持随机访问。如果False
seek()
tell()
和truncate()
会抬起OSError
tell
()- 返回当前的流位置
truncate
//( size =无)- 将流调整为给定的大小以字节为单位(或当前位置大小未指定)。当前流位置未更改。此大小调整可以扩展或减小当前文件大小。在扩展的情况下,新文件区域的内容取决于平台(在大多数系统上,额外的字节是零填充的)。返回新文件大小
更改版本3.5: Windows现在将在扩展时归零文件。
writable
()- 返回
True
如果流支持写入。如果False
write()
和truncate()
会举起OSError
writelines
(行)- 写一个行列表到流。不添加行分隔符,因此通常每条行提供的行都有一个行分隔符
__del__
// ()- 准备破坏对象。
IOBase
提供了这个方法的defaultimplementation,它调用实例的close()
方法
- class
io.
RawIOBase
- 原始二进制I / O的基类。它继承了
IOBase
。有一个nopublic构造函数。原始二进制I / O通常提供对底层OS设备或API的低级访问,并且不会尝试将其封装在高级原语中(这留给缓冲I / O和文本I / O,本页稍后将对此进行介绍))。
除了
IOBase
RawIOBase
的属性和方法之外,还提供了以下方法:read
( size = -1 )- 从对象读取大小字节并归还他们。为方便起见,如果大小未指定或-1,则返回EOF之前的所有字节。否则,只进行一次系统调用。小于尺寸如果操作系统调用返回少于大小字节,则可能返回字节。
如果返回0个字节,并且大小不为0,则表示文件结束。如果对象处于非阻塞模式且没有可用的字节,则
None
被退回。默认实现推迟到
readall()
和readinto()
readall
()- 读取并返回流中的所有字节,直到EOF,如果使用multiplecalls到流必要的
readinto
(b)- 将字节读入预先分配的,可写的字节对象 b ,并返回读取的字节数。如果对象处于非阻塞模式且没有可用的字节,则
None
返回.
write
(b)- 将给定的字节对象 b 写入下面的原始流,并返回写入的字节数。这可能小于 b inbytes的长度,具体取决于底层原始流的具体情况,特别是如果它处于非阻塞模式。
None
如果原始流设置为不阻塞并且没有单个字节可以容易地写入它,则返回。调用者可以在此方法返回后释放或改变 b ,因此实现只能在方法调用期间访问 b
- class
io.
BufferedIOBase
- 支持某种缓冲的二进制流的基类。它继承
IOBase
。没有公共构造函数。与
RawIOBase
的主要区别在于方法read()
readinto()
和write()
将尝试(分别)读取所请求的输入量或消耗所有给定的输出,但代价可能是更多比一个系统调用。另外,如果底层原始流处于非阻塞模式并且不能获取或提供足够的数据,那些方法可以提升
BlockingIOError
;不像他们的RawIOBase
同行,他们什么时候会回来None
。此外,
read()
方法没有一个违反readinto()
的defaultimplementation。一个典型的
BufferedIOBase
实现不应该继承RawIOBase
实现,但包装一个,如BufferedWriter
和BufferedReader
做。BufferedIOBase
提供或覆盖这些方法和属性,而不是来自IOBase
:raw
RawIOBase
处理的基础原始流(BufferedIOBase
实例)。这不是BufferedIOBase
API的一部分,在某些实现中可能不存在.
detach
()- 从缓冲区中分离出底层原始流把它返还。
原始流分离后,缓冲区处于不可用状态。
某些缓冲区(如
BytesIO
)没有从此方法返回单一流的概念。他们举起UnsupportedOperation
新版3.1.
read
(size=-1)- 阅读并返回大小字节。如果省略参数,
None
或负数,则读取并返回数据,直到达到EOF。空bytes
如果流已经在EOF,则返回对象。如果参数为正,并且基础原始流不是交互式的,则可以发出多个原始读取以满足字节计数(除非首先达到EOF)。但对于交互式原始流,最多只会发出一次原始读取,而简短的结果并不意味着EOF是非常重要的。
如果底层原始流是无限阻塞模式,并且目前没有可用数据,则会引发
BlockingIOError
.
read1
( [size] )- 读取并返回大小字节,最多只调用一次原始流的
read()
(或readinto()
)方法。如果您在BufferedIOBase
对象上实现自己的缓冲,这可能很有用。如果大小是
-1
(默认值),则返回任意数量的字节(除非达到EOF,否则大于零).
readinto
( b )- 将字节读入预先分配的,可写的字节对象 b 并返回读取的字节数。
像
read()
一样,可以向底层原始流发出多个读取,除非后者是交互式的。如果基础原始流处于非阻塞模式,并且此时没有可用数据,则会引发
BlockingIOError
.
readinto1
(b)- 将字节读入预分配的,可写的字节对象 b ,最多使用一次调用底层原始流
read()
(或readinto()
)方法返回读取的字节数。如果基础原始流处于非阻塞模式,并且此时没有可用数据,则会引发
BlockingIOError
。版本3.5中的新内容
write
// (b)- 用给定的字节来写对象 b ,并返回写入的字节数(总是等于 b 的长度,以字节为单位,因为如果写入失败
OSError
将被提出)。根据实际实现,这些字节可以很容易地写入底层流,或者保存在缓冲区中以获得性能和延迟原因。当处于非阻塞模式时,如果需要将数据写入原始流但是它无法接受所有数据而没有阻塞,则会引发
BlockingIOError
。调用者可以在此方法返回后释放或改变 b ,因此实现只应在方法调用期间访问 b
原始文件I / O
- 类
io.
FileIO
(名称 mode =“r” closefd = True opener =无) FileIO
表示包含字节数据的操作系统级文件。它实现了RawIOBase
接口(因此IOBase
接口也是如此)。名称可以是以下两种情况之一:
- 一个字符串或
bytes
对象,表示将要打开的文件的路径。在这种情况下,closefd必须是True
(默认值),否则会出错. - 一个整数,表示生成的
FileIO
对象将提供访问权限的现有操作系统级文件描述符的编号。当关闭文件对象时,这个fd也将被关闭,除非 closefd 设置为False
模式可以是
"r"
"w"
"x"
或"a"
用于阅读(默认),写作,独家创作或追加。如果在打开写入或附加时该文件不存在,则该文件将被处理;它会在打开写入时被截断。如果打开创建时已经存在FileExistsError
将被提升。打开文件以创建简单的写入,因此该模式的行为方式与"w"
类似。在模式中添加"+"
以允许同时读写。read()
(用正面参数调用时),readinto()
和write()
这个类的方法只会进行一次系统调用。可以通过传递一个可调用的开启者来使用自定义开启器。然后通过调用开启者带(名称标志)。开启者必须返回一个打开的文件描述符(传递
os.open
为开启者导致功能类似于传递None
)。新创建的文件不可继承。
有关使用
open()
开启参数的示例,请参阅内置函数。在版本3.3中更改:添加了开启参数。添加了
"x"
模式。在版本3.4中更改:文件现在是不可继承的。
除了
IOBase
和RawIOBase
FileIO
的属性和方法之外,还提供了以下数据属性:mode
- 构造函数中给出的模式.
name
- 文件名。当构造函数中没有名称时,这是文件的文件描述符.
- 一个字符串或
Buffered Streams
缓冲I / O流为原始I / O提供了更高级别的I / O接口。
- class
io.
BytesIO
( [ initial_bytes ] ) - 使用内存中字节缓冲区的流实现。它继承了
BufferedIOBase
。调用close()
方法时,缓冲区被丢弃。可选参数 initial_bytes 是类似于字节的对象包含初始数据。
BytesIO
除了BufferedIOBase
和IOBase
之外,还提供或覆盖这些方法:getbuffer
()- 返回缓冲区内容的可读写视图,而不复制它们。此外,改变视图将透明地更新缓冲区的内容:
>>> b = io.BytesIO(b"abcdef") >>> view = b.getbuffer() >>> view[2:4] = b"56" >>> b.getvalue() b"ab56ef"
注意
只要视图存在,
BytesIO
对象就不能被删除或关闭.新版本3.2.
getvalue
( )- 返回
bytes
包含缓冲区的全部内容.
read1
( [尺寸] )- 在
BytesIO
,这跟read()
更改版本3.7:尺寸参数现在是可选的。
readinto1
(b )- 在
BytesIO
,这与readinto()
版本3.5相同。
- class
io.
BufferedReader
( raw buffer_size = DEFAULT_BUFFER_SIZE ) - 一个缓冲区,提供对可读,顺序
RawIOBase
对象的更高级别访问。它继承BufferedIOBase
。当从该对象读取数据时,可以从底层原始流请求更大量的数据,并将其保存在内部缓冲区中。然后可以在后续读取时直接返回缓冲的数据。构造函数为给定的可读
BufferedReader
raw stream和 buffer_size 创建一个。如果省略 buffer_size ,则使用DEFAULT_BUFFER_SIZE
。BufferedReader
除了BufferedIOBase
和IOBase
之外,还提供或覆盖了这些方法:peek
( [ size ] )- 从流中返回字节而不提升位置。最多单个读取原始流以完成呼叫。返回的字节数可能少于或多于要求.
read
( [size])- 读取并返回大小字节,或者大小是给定还是否定,直到EOF或如果读取呼叫会以非阻塞模式阻止.
read1
( [size])- 读取并返回大小字节,只对原始流进行一次调用。如果至少缓冲一个字节,则只缓冲字节返回。否则,进行一次原始流读取调用。
在版本3.7中更改: 大小参数现在是可选的。
- class
io.
BufferedWriter
( raw buffer_size = DEFAULT_BUFFER_SIZE ) - 提供更高级访问权限的缓冲区到一个可写的,顺序的
RawIOBase
对象。它继承BufferedIOBase
。写入此对象时,数据通常放入内部缓冲区。缓冲区将在各种条件下写出到底层RawIOBase
对象,包括:- 当缓冲区对于所有待处理数据变得太小时;
- 当
flush()
被调用时; - 当需要
seek()
时(对于BufferedRandom
物品); - 当
BufferedWriter
物体被关闭或毁坏时
构造函数为给定的可写
BufferedWriter
原始流创建一个。如果没有给出 buffer_size ,则默认为DEFAULT_BUFFER_SIZE
BufferedWriter
提供或覆盖这些方法以及BufferedIOBase
和IOBase
:flush
()- 将缓冲区中保存的字节强制转换为原始流。如果原始流阻塞,应该提高
BlockingIOError
write
(b)- 写 bytes-like object b ,并返回写入的字节数。当处于非阻塞模式时,如果需要写出缓冲区,则会引发
BlockingIOError
但原始流阻塞
- //class
io.
BufferedRandom
( raw buffer_size = DEFAULT_BUFFER_SIZE ) - 随机访问流的缓冲接口。它继承了
BufferedReader
和BufferedWriter
,并进一步支持seek()
和tell()
功能。构造函数为第一个参数中给出的可搜索原始流创建了一个读写器。如果 buffer_size 被省略,则默认为
DEFAULT_BUFFER_SIZE
BufferedRandom
可以有任何BufferedReader
或BufferedWriter
可以做.
- class
io.
BufferedRWPair
(读者作家 buffer_size = DEFAULT_BUFFER_SIZE ) - 一个缓冲的I / O对象,将两个单向
RawIOBase
对象 – 一个可读,另一个可写 – 组合成一个双向终点。它继承BufferedIOBase
读者和编者分别是RawIOBase
可读和可写的对象。如果省略 buffer_size ,则默认为DEFAULT_BUFFER_SIZE
BufferedRWPair
实现BufferedIOBase
的所有方法,而不是detach()
,这会引发UnsupportedOperation
警告
BufferedRWPair
不会尝试同步访问基础原始流。你不应该把它和读者和作者一样传递给它;用BufferedRandom
代替
文本I / O
- 类
io.
TextIOBase
- 文本流的基类。此类为流I / O提供基于字符和行的接口。没有
readinto()
方法,因为Python的字符串是不可变的。它继承IOBase
。没有公共构造函数。TextIOBase
提供或覆盖这些数据属性和IOBase
以外的方法和方法:encoding
- 用于解码流的字节intostrings并将字符串编码为字节的编码名称.
errors
- 解码器或编码器的错误设置.
newlines
- 字符串,字符串元组或
None
,表明到目前为止新线传输。根据实现和initialconstructor标志,这可能不可用.
buffer
- 底层二进制缓冲区(
BufferedIOBase
那个TextIOBase
对付。这不是TextIOBase
API并且在某些实现中可能不存在.
detach
()- 将底层二进制缓冲区与
TextIOBase
并且回复它。在分离底层缓冲区后,
TextIOBase
处于不可用状态。有些
TextIOBase
实现,比如StringIO
,可能没有底层缓冲区的概念,调用这个方法会引发UnsupportedOperation
版本3.1.
read
(size=-1)- 最多读取和返回大小流中的字符为单个
str
。如果尺寸为负或None
,则读到EOF.
readline
(size=-1)- 读取直到换行符或EOF并返回单个
str
。如果流已经在EOF,则返回空字符串。如果指定尺寸,最多尺寸将被读取字符
seek
(offset [ whence ] )- 将流的位置改为给定的偏移。行为取决于 whence 参数。的默认值是
SEEK_SET
SEEK_SET
或0
:从流的开头搜索(默认值);偏移必须是TextIOBase.tell()
返回的数字,或者为零。任何其他偏移 valueproduces undefined behaviour。SEEK_CUR
或1
:“寻找”到当前位置; 偏移必须为零,这是一个无操作(所有其他值都不受支持).SEEK_END
或2
:寻找到流的末尾; 偏移必须为零(所有其他值都不受支持).
将新的绝对位置作为不透明数字返回。
版本3.1中新增:
SEEK_*
常量。
tell
()- 将当前流位置作为不透明数字返回。数字通常不代表底层二进制存储器中的字节数.
write
(s)- 写成字符串s 到流并返回写入的字符数.
- class
io.
TextIOWrapper
(缓冲编码=无 errors =无 newline =无 line_buffering = False write_through = False ) - 缓冲的文本流在
BufferedIOBase
二进制流上。它继承了TextIOBase
编码给出了将被解码的流编码的名称。默认为locale.getpreferredencoding(False)
错误是一个可选字符串,用于指定如何处理编码和解决错误。如果有编码错误(默认为"strict"
),请ValueError
提出None
具有相同的效果),或通过"ignore"
忽略错误。(请注意,忽略编码会导致数据丢失。)"replace"
会导致替换标记(例如"?"
)插入格式错误的数据。"backslashreplace"
导致格式错误的数据被abackslashed转义序列取代。在编写时,可以使用"xmlcharrefreplace"
(用适当的XML字符引用替换)或"namereplace"
(用\N{...}
转义序列替换)。使用codecs.register_error()
注册的任何其他错误处理名称也是有效的。换行符控制行结尾的处理方式。它可以是
None
""
"\n"
"\r"
和"\r\n"
。它的工作原理如下:- 当从流中读取输入时,如果换行是
None
通用换行符模式已启用。输入中的行可以以"\n"
"\r"
或"\r\n"
结尾,并在返回给调用者之前将它们转换为"\n"
。如果是""
,通用newlinesmode已启用,但行结尾将返回给调用者未翻译。如果它具有任何其他合法值,则输入行仅由给定字符串终止,并且行结尾将返回给calleruntranslated. - 当将输出写入流时,如果换行是
None
,则写入的任何"\n"
字符都将转换为系统默认行分隔符,os.linesep
。如果换行是""
或"\n"
,没有翻译的地方。如果换行符是任何其他合法值,则所写的任何"\n"
字符都会被翻译成给定的字符串.
如果 line_buffering 是
True
flush()
在调用towrite包含换行符或回车符时隐含。如果 write_through 是
True
,保证不会缓冲对write()
的调用:TextIOWrapper
对象上写的任何数据都是立即的处理它的底层二进制缓冲区在版本3.3中更改: 写入参数已被添加。
在版本3.3中更改:默认编码现在是
locale.getpreferredencoding(False)
而不是locale.getpreferredencoding()
。不要使用locale.setlocale()
更改临时的thelocale编码,使用当前的localeencoding而不是用户首选编码。TextIOWrapper
除了TextIOBase
及其父母之外,还提供这些成员:line_buffering
- 是否启用了行缓冲.
write_through
- 是否将写入立即传递给基础二进制缓冲区。
版本3.7中的新内容.
reconfigure
( * [,encoding] [,errors] [,换行符] [,line_buffering] [,write_through] )- 使用编码的新设置重新配置此文本流错误换行 line_buffering 和 write_through 。
未指定的参数保持当前设置,除了
errors="strict
指定编码但错误未指定。如果已从流中读取某些数据,则无法更改编码或换行符。另一方面,写入后的changingencoding是可能的。
此方法在设置新参数之前执行隐式流刷新。
版本3.7.
- 当从流中读取输入时,如果换行是
- class
io.
StringIO
( initial_value =“” newline =“\ n”) - 文本I / O的内存中流。调用
close()
方法时,将丢弃文本缓冲区。可以通过提供initial_value来设置缓冲区的初始值。如果启用了换行符,则换行符将被编码为
write()
。流位于缓冲区的起始处。换行参数的作用类似于
TextIOWrapper
。默认是只考虑\n
字符作为行的结尾而不进行换行。如果换行符设置为None
,则换行符在所有平台上写为\n
,但在读取时仍会执行universalnewline解码。StringIO
提供此方法以及TextIOBase
及其父母的方法:getvalue
()- 返回
str
包含缓冲区的全部内容。新行解码就好像是read()
,尽管如此溪流位置没变.
用法示例:
import iooutput = io.StringIO() output.write("First line.") print("Second line.", file=output) # Retrieve file contents -- this will be # "First line.Second line." contents = output.getvalue() # Close object and discard memory buffer -- # .getvalue() will now raise an exception. output.close()
 
- class
io.
IncrementalNewlineDecoder
- 帮助编解码器解码通用换行符 mode的换行符。它继承
codecs.IncrementalDecoder
性能
本节讨论所提供的具体I / O实现的性能。
二进制I / O
通过读取和写入大块数据,即使用户要求单个字节,缓冲I / O也会隐藏调用和执行操作系统的无缓冲I / O例程的任何低效率。增益取决于OS和执行的I / O的风。例如,在某些现代操作系统(如Linux)上,无缓冲磁盘I / O可以与缓冲I / O一样快。然而,最重要的是,缓冲I / O提供了可预测的性能,无论平台和支持设备如何。因此,对于二进制数据,几乎总是优选使用缓冲I / O而不是无缓冲I / O.
文字I / O
二进制存储(例如文件)上的文本I / O明显慢于同一存储上的二进制I / O,因为它需要使用字符编解码器在单元和二进制数据之间进行转换。这可能会变得很明显地处理大量的文本数据,如大型日志文件。而且,TextIOWrapper.tell()
和TextIOWrapper.seek()
对于所使用的重建算法来说都非常慢。
StringIO
然而,它是一个本机内存unicode容器,并且与BytesIO
多线程
FileIO
对象在操作系统调用的范围内是线程安全的(例如read(2)
在Unix下)它们的包装也是线程安全的。
二进制缓冲对象(BufferedReader
BufferedWriter
BufferedRandom
和BufferedRWPair
使用锁保护其内部结构;因此,可以安全地从多个线程同时调用它们。
TextIOWrapper
对象不是线程安全的。
重入
二进制缓冲对象(BufferedReader
BufferedWriter
BufferedRandom
和BufferedRWPair
)不是可重入的。虽然在正常情况下不会发生可重入呼叫,但是在中进行I O时可能会出现这种情况signal
处理程序。如果一个线程试图重新输入它已经访问的缓冲对象,那么RuntimeError
被提出来了。请注意,这并不禁止其他线程进入缓冲对象。
以上隐含扩展到文本文件,因为open()
functionWill将一个缓冲的对象包装在TextIOWrapper
。这包括标准流,因此影响内置功能print()
。