お久しぶりです、エンジニアのMasashiです。
今回は、ファイルの書き込み速度について比較を行いたいと思います。
ファイル書き込みに関しての要望は多く、テキスト形式、csv形式の違いはあれど
多く実装されているのではないかと思います。
今回はファイルの書き込みを行う関数の速度を4つの方法から検証してみたいと思います。
測定までの流れ
今回測定を行うのは、【0123456789】という文字列を500,000回、
txt形式で書き込むまでに要した時間になります。
比較対象としてStreamWriterをtry~finallyの形で記載したもの、StreamWriterをusingを使用して記載したもの、AppendAllTextを使用、WriteAllLinesを使用の4つの場合について検証しています。
AppendAllTextについては、毎回ファイルのオープン・クローズが走ることで速度が
どの程度遅くなってしまうのかを計測するために、Loop内で使用するという間違った使い方で計測しています。
測定環境
- CPU:Intel(R) Core(TM) i7-7500U CPU @ 2.70GHz (4 CPUs), ~2.9GHz
- メモリ:16GB
- Visual Studio 2015
対象データ
- 書き込む文字列:0123456789
- 書き込む回数:500,000
- ファイル形式:txt形式
測定対象
- StreamWriterをtry~finallyで記載
- StreamWriterをusingを使用して記載
- AppendAllTextを使用
- WriteAllLinesを使用
テストコード
ファイル書き込み速度の測定結果
10回試行した結果の平均値が下記になっています。小数点第1位で四捨五入しています。
計測項目 | 計測時間(ms) |
---|---|
StreamWriterをtry~finallyで記載 | 81 |
StreamWriterをusingを使用して記載 | 78 |
AppendAllTextを使用 | 測定不能 |
WriteAllLinesを使用 | 100 |
結果の比較の前にAppendAllTextを使用したパターンですが、毎回ファイルのオープン・クローズを行うため、
結果の取得に非常に時間がかかり、計測することを諦めたため、計測不能という形で記載させていただきました。
上記関数は、オープン・クローズをユーザーが意識しなくていい形で使用できる関数であるため、
文字列形式を素直に1度書き込ませるだけであれば速度面の問題はありません。
今回の計測には入れていませんが、配列形式のデータを文字列形式に直した形のものをAppendAllTextを使用して
書き込ませてみました。
配列形式のデータを文字列に加工する段階から速度を計測した場合、StreamWriterを使用したパターンと速度に違いはありませんでしたので、正しい使い方をする分には問題ありません。
StreamWriterを使用したパターンは若干ですが、usingを使用したほうが速度が速くなりました。
測定誤差かと考え何度か計測を行ってみましたが、必ずusingを使用したほうが速い結果となるためそのあたりも今後調査してみたいと思います。
WriteAllLinesはデータを書き込むたびに改行を加えてくれるため、その分が速度差として現れただけだと考えられます。
ファイル書き込み速度のまとめ
ファイル書き込みの処理を行う際は、基本的にはどの関数を使用していただいても速度面で問題になることはないかと考えられます。
AppendAllTextを使用する場合は、データを加工してから使用することで、ファイルのオープン・クローズ処理を意識する必要がないため非常に便利です。
StreamWriterを使用する場合は、非常に小さい値ですが速度差が生まれるため、usingを使用して実装するのがいいかと思います。
またusingを使用することでClose処理を意識しなくてすむため、finallyでClose処理を入れることを忘れていたようなバグを防ぐことができます。
WriteAllLinesを使用する場合は、改行を入れる処理を意識しなくていいため、取得したデータを改行して書き込んでほしいという要望がある場合は使用することになると思います。
今回の計測により関数単位では、大きな速度差を見つけることはできませんでしたが、状況に応じて使用する関数を決めていいことがわかる結果になったかと思います。
この記事が少しでも皆さんのお役に立てば幸いです。